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Introducere 





Our knowledge, our attitudes, and our actions are based to a very large 
extent on samples. This is equally true in everyday life and in scientific research. 


W.G. Cochran 


Ca și în ediția anterioară, în această lucrare prezentăm câteva elemente de 
bază ale teoriei şi ale practicii sondajului statistic, care pot fi utile cititorului 
specializat sau celui ce doreşte să se iniţieze în acest domeniu. O nouă ediţie a 
acestei cărți aduce câteva modificări faţă de prima versiune. Sunt aduse completări 
atât cu privire la elementele teoretice şi metodologice, cât şi cu privire la exemple 
şi exerciţii. Structura cărții nu se modifică față de prima ediţie, însă au fost 
introduse noi elemente care să faciliteze demersul însușirii cunoștințelor privind 
cercetarea pe bază de sondaj statistic. 

Subliniem remarca lui W.G. Cochran potrivit căreia societatea actuală este 
marcată în mod semnificativ de practica sondajelor statistice. Aproape fără 
excepție, metoda cercetării prin sondaj este folosită în toate ştiinţele şi în activitatea 
socio-economică obișnuită a instituţiilor societăţii moderne. Argumentele unei 
asemenea prezenţe sunt legate îndeosebi de puterea de cunoaștere pe care o oferă 
sondajul statistic. Există însă și situaţii în care sondajul reprezintă singura 
posibilitate de a realiza o cercetare ştiinţifică asupra realităţii (sunt cunoscute 
exemplele din medicină și industria farmaceutică, din domeniul controlului calității 
produselor sau cele cu privire la opinia populaţiei etc.). 

În literatura de specialitate se întâlnesc lucrări ce prezintă sondajul statistic 
din perspective foarte diverse. Există lucrări, scrise din perspectiva statisticianului, 
care sunt foarte tehnice și din care lipsesc elemente de metodologie privitoare la 
partea de elaborare a unei anchete prin sondaj sau elementele organizatorice 
specifice acestei cercetări. De cealaltă parte, se întâlnesc situaţii în care sondajul 
este prezentat de o manieră simplificată, fără prea multe detalii legate de 
fundamentarea statistică a tehnicilor de sondaj. Asemenea lucrări sunt scrise din 
perspectiva cercetătorilor din domeniul științelor sociale, interesul acestora fiind 

” legat de utilizarea metodelor de sondaj pentru diverse obiective de cercetare. 
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Intenţia acestei lucrări este aceea de a oferi cititorilor o carte introductivă cu 
privire la teoria şi practica sondajului statistic, care ia în considerare observaţiile de 
mai sus. Cartea se adresează tuturor cercetătorilor, indiferent de nivelul de 
cunoştinţe de statistică şi matematică. În primul capitol al lucrării sunt prezentate 
elemente metodologice şi organizatorice strict necesare pentru a putea elabora o 
cercetare prin sondaj. Accentul este pus pe etapa de elaborare a temei de cercetare, 
a instrumentului de culegere a datelor şi a unui plan de sondaj. În capitolele 
următoare sunt prezentate câteva metode de sondaj împreună cu fundamentarea 
Statistică, fără de care nu se poate garanta condiţia de reprezentativitate a 
eşantionului şi, prin urmare, calitatea rezultatelor. Astfel, în capitolul al doilea se 
discută detaliat cea mai cunoscută metodă de sondaj statistic: sondajul aleator 
simplu. În al treilea capitol sunt prezentate câteva metode de sondaj empirice sau 
non-aleatoare. Urmează un capitol dedicat planurilor de sondaj mixte care combină 
principiile de selecţie ale metodelor prezentate anterior, adică aleator şi empiric. 
Lucrarea se încheie cu prezentarea unor metode de îmbunătăţire a calității 
rezultatelor sondajelor prin utilizarea unei informaţii suplimentare în etapa de 
estimare a parametrilor. 


Iaşi, iulie 2018 Dănuţ- Vasile Jemna 





Capitolul 1 


FUNDAMENTELE CERCETĂRII PRIN SONDAJ 


| Ca principiu de cunoaştere, sondajul este utilizat în toate domeniile vieţii 
sociale și economice, atât în forme intuitive, neștiințifice, cât şi în contextul unor 
cercetări ce presupun rigoarea metodologică a științelor moderne. Ca metodă de 
cercetare ştiinţifică, sondajul face parte din categoria cercetărilor statistice, 
cantitative și este utilizat în toate domeniile cunoaşterii: economie, ştiinţe sociale, 
ştiinţe ale naturii, medicină.ţ Sondajul s-a impus ca o posibilitate de cunoaștere a 
unei populații statistice (de regulă, definite ca un ansamblu de unităţi reale de 
volum mare) prin studierea unei părți a acesteia, numite eșantion, extrase din 
ansamblu după un procedeu care asigură condiția de reprezentativitatej Rezultatele 
obținute prin analiză statistică la nivelul eşantionului sunt apoi extrapolate la 
nivelul întregului, pentru a atinge obiective precum estimarea unor parametri sau 
verificarea unor ipoteze statistice formulate cu privire la populaţia analizată. 

În acest capitol ne propunem o introducere cu privire la fundamentele 
cercetării prin sondaj. Ne interesează câteva coordonate istorice, prin care se 
subliniază condițiile care au favorizat apariţia și dezvoltarea acestei metode de 
cercetare. Secţiunea următoare este dedicată conceptului de reprezentativitate a 
unui sondaj. Partea cea mai elaborată a acestui capitol vizează prezentarea unor 
probleme teoretice și metodologice ale sondajului, potrivit demersului său 
metodologic: formularea unei probleme de cercetare, construirea chestionarului 
statistic şi elaborarea unui plan de sondaj. În ultima secţiune sunt prezentate câteva 
aspecte organizatorice, care corespund punerii în practică a cercetării prin sondaj. 
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1.1. De la cercetările exhaustive la cele selective 


Viaţa de zi cu zi este marcată de statistică şi de studiile pe bază de sondaj. În 
permanenţă, instituţii guvernamentale şi firme private organizează sondaje 
statistice pentru a culege date din industrie, agricultură, comerț, servicii, medicină, 
demografie, sănătate, politică, divertisment, cultură şi societate etc.iCercetarea pe 
bază de sondaj statistic, deşi atât de cunoscută și larg folosită în prezent în toate 
ştiinţele, are o istorie recentă. Secolul al XX-lea poate fi numit secolul sondajelor, 
pentru că în această perioadă s-au dezvoltat fundamentele teoretice și metodologice 
ale acestei metode de cercetarej Publicul larg s-a obișnuit deja cu terminologia 
specifică metodei, pentru că rezultatele anchetelor prin sondaj sunt în permanență 
prezentate opiniei publice prin mass-media și studii de specialitate. 


1.1.1. Terminologie 


|_în societatea actuală, termenii de specialitate din diverse ştiinţe sunt 
popularizați prin mijloacele de comunicare în masă,j Acest aspect este valabil mai 
ales cu privire la statistică.) Publicul larg este familiarizat cu noţiuni specifice 
cercetării pe bază de sondaj pentru că o cantitate importantă de informaţii este 
obținută cu ajutorul acestei metode de investigare a realității și apoi este diseminată 
în mass-media. Terminologia legată de sondajul statistic este prezentă în spaţiul 
public nu numai în limba română, ci și în limbile de circulație internaţională. În 
bagajul culturii generale se regăsesc termeni precum eșantion, exit-poll, eroare, 
estimaţie, sondaj de opinie, probabilitate etc. 
iu de a ne fixa asupra unei definiţii ştiinţifice, putem sublinia că 
termenul sondaj este prezent în vocabularul comun cu diverse nuanțe și este utilizat 
cu sensuri specifice în diverse domenii ale activităţii umane) Dacă pentru statistică 
s-a impus un termen generic în toate limbile moderne de-cîrculaţie internațională 
(statistics, Statistique, statistik etc.), pentru sondaj lucrurile nu sunt la fel. Ca 
etimologie, termenul provine din limba franceză (sondage), având sensul de a 
sonda sau a analiza un mediu oarecare (Larousse, 1995, p. 948). Originile 
termenului sunt legate de substantivul sonde, care provine de la un termen nordic 
ce desemnează un instrument de măsurare a adâncimii apei. Sensului maritim al 
termenului i se adaugă apoi, succesiv, sensul medical (sonda chirurgicală), sensul 
enoseologic (a sonda, a încerca să afli gândurile, sentimentele, intenţiile cuiva, a 
iscodi, a tatona, conform DEX, Bucureşti, p. 1003), sensul geologic, sociologic etc. 
au modern şi ştiinţific al termenului sondaj este legat îndeosebi de 
cercetătla statistică. În acest context, sondajul desemnează o metodă de cercetare 
parţială a unei colectivităţi. Vorbim despre o acţiune prin care se analizează un 
eşantion extras dintr-o populaţie, iar rezultatele obținute sunt extinse la nivelul 
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întreguluij Cu acest sens, termenul se impune atât în literatura de specialitate, cât şi 
în limbajul comun, în cadrul limbilor francofone, grație aplicării pe scară largă a 
anchetelor de opinie publică, îndeosebi după anul 1930. 

În literatura de limbă engleză există o altă terminologie, care are la bază 
termenul sample, corespondentul pentru eșantion. De altfel, în această limbă s-au 
consacrat termeni diferiţi pentru activităţi din domenii distincte, dar care utilizează 
acelaşi principiu. De exemplu, în sociologie, pentru sondajul de opinie avem 
echivalentul englez poll, iar, în ştiinţele economice, pentru sondajul statistic avem 
termenul sampling. 


1.1.2. Scurt istoric şi condiții pentru dezvoltarea cercetării prin sondaj 


Practica de a „sonda”, adică de a face o evaluare pe seama unei mostre, a 
unei părți dintr-un întreg, este una foarte veche și, în acelaşi timp, una foarte 
actuală (de la banala degustare până la analiza vizuală a unei lucrări artizanale sau 
a recoltei de pe un ogor etc.). Această analiză corespunde unei evaluări intuitive 
asupra unor caracteristici ale realităţii, având convingerea că informaţiile obținute 
pentru partea analizată sunt valabile şi pentru întreg. Sondarea realității prin apelul 
la părți ale acesteia are de a face cu principiul eficienței. Nu putem cunoaște 
realitatea în mod exhaustiv decât în anumite cazuri și nu dispunem decât de resurse 
financiare, de timp, umane etc. limitate. 

Încercări de estimare a unor mărimi prin observarea unei părți din realitate 
sunt întâlnite chiar din antichitate (un exemplu îl oferă Herodot în storia sa, 
prezentând cum anume regele Persiei estimează numărul soldaţilor în campania de 
cucerire a Greciei). Primele tentative de extrapolare a rezultatelor parțiale bazate pe 
raționamente şi metode ştiinţifice datează din secolul al XIV-lea. În această 
perioadă de timp au loc diverse încercări de estimare a numărului populaţiei 
pornind de la conceptul de „foc”, care face referire la o locuinţă, familie sau 
gospodărie (Droesbeke et al., 1987, p. 4). Din această perioadă datează primele 
înregistrări ale fenomenelor demografice în acte de stare civilă, activitate care 
asigură principala sursă de date statistice. Rezultatele cele mai semnificative, însă, 
apar în secolul al XVII-lea, odată cu formarea Școlii Aritmeticii Politice Engleze. 
Prin folosirea fehnicii multiplicatorului, W. Petty (1623-1687) şi mai apoi Laplace 
(1749-1827) ajung la rezultate spectaculoase în estimarea a numeroşi indicatori 
demografici şi economici (de exemplu, Petty estima populaţia Londrei, în 1686, 
calculând mai întâi o estimaţie de 88 de mii de case, care adăpostesc aproximativ 
695 de mii de persoane). La început, având un caracter intuitiv şi logic, metoda de 
cercetare parţială capătă mai apoi o justificare teoretică prin apariţia şi dezvoltarea 
teoriei probabilităților. Metoda este astfel îmbunătăţită ulterior prin contribuţiile lui 
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Laplace şi ale altor matematicieni și a fost utilizată cu succes în câteva cazuri în 
Franţa şi Anglia, în secolul al XVIII-lea. În ciuda acestor realizări, secolul următor 
avea să rămână în istorie ca o perioadă dominată de metoda recensământului. Noile 
state moderne europene, motivate de nevoia de cunoaştere exhaustivă a realităţii, 
au organizat regulat recensăminte prin intermediul instituţiilor de statistică 
înfiinţate la nivelul administraţiei. 

Formalizarea şi utilizarea pe scară largă a metodelor de cercetare prin sondaj 
este una târzie (este legată de prima parte a secolului al XX-lea), dacă ne gândim că 
primele încercări de extrapolare şi primele formalizări teoretice ale cercetării 
parţiale datează din secolul al XVII-lea. O explicaţie a acestui fapt, dintr-o 
perspectivă a istoriei şi sociologiei ştiinţei, ar fi aceea că nu au existat condiţiile 
cognitive (ştiinţifice şi filosofice) şi sociale (pragmatice şi politice) care să facă 
posibilă această dezvoltare. Ne oprim în continuare asupra unor repere şi condiţii 
care au creat cadrul dezbaterilor asupra cercetării prin sondaj la sfârşitul secolului 
al XIX-lea şi începutul secolului al XX-lea. 


a. Interesul politic şi administrativ 

Deși secolul al XIX-lea a fost dominat de cercetările pe bază de 
recensământ, nevoia de cunoaştere a realităţii se diversifică, iar necesarul de 
informaţii devine tot mai mare şi mai divers. Este clar că metoda exhaustivă nu mai 
poate ține pasul cu asemenea nevoi. Acest lucru devine tot mai clar și pentru 
administraţie. După apariţia statelor moderne europene, se conturează ideea de stat 
ca diversitate geografică, demografică, socială, economică din interiorul unei 
graniţe. A cunoaşte statul înseamnă a lua în considerare teritoriul şi diversitatea sa. 
Această idee va fi valorificată din plin de autori precum statisticianul N.A. Kiaer 
(1895), care vorbeşte despre reprezentativitate în sens teritorial. O investigaţie 
reprezentativă înseamnă, la Kiaer, o explorare a unui număr de localităţi, 
distribuite, pe întreg teritoriul ţării, în așa manieră încât subansamblul localităților 
cercetate să fie o miniatură a întregului teritoriu. La nivel administrativ, prin 
instituţiile de statistică oficială, interesul statului cu privire la diverse probleme 
care privesc guvernarea a condus la dezvoltarea metodelor selective de culegere și 
analiză a datelor. Asemenea metode s-au dovedit a fi apoi nu numai singurele 
eficiente sub raportul timpului şi costului, ci și singurele posibile. 

Diversificarea nevoii de cunoaştere, împreună cu posibilităţile şi limitele ce 
însoțesc activitatea administrativă, a condus la utilizarea pe scară largă a sondajului 
la nivelul instituţiilor oficiale de statistică. Actualmente, cea mai mare parte a 
datelor necesare guvernării se obţin cu ajutorul sondajelor statistice oficiale. 
Acestea au caracter reprezentativ la nivel naţional și se organizează cu regularitate 
după metodologii ştiinţifice riguroase. Rezultatele anchetelor sunt puse atât la 
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dispoziţia guvernelor, cât şi a instituţiilor de învățământ și cercetare şi chiar a 
publicului larg (sub formă de indicatori sintetici prezentaţi în diverse publicaţii de 
popularizare). 


b. Condiţiile sociale și economice 

Noul stat democratic deschis de modernitate a dus la dezvoltarea unor 
instrumente juridice şi politice importante, cum ar fi codul civil şi sufragiul 
universal. Mass-media devine o putere în statul modern, realizând posibilitatea 
exprimării a ceea ce numim opinie publică. Consultarea opiniei populaţiei în 
diverse probleme, mai ales a opiniei politice, reprezintă o problemă actuală de 
democraţie care a dus la dezvoltarea anchetelor de opinie şi a campaniilor 
electorale naţionale prin mass-media. America este ţara care a dat tonul şi modelul 
unei astfel de societăţi încă din secolul al XIX-lea. În acest secol, în SUA, se 
realizează primele sondaje de opinie, iniţiativă care vizează obţinerea de informaţii 
despre opinia populaţiei în legătură cu politicul. Motorul acestor anchete îl 
constituie organismele de presă, iar metoda este simplă: consultarea opiniilor 
personale prin presă. Primele anchete debutează în 1824, prin jurnalele 
Pennsylvenian  Harrisburg şi Raleigh Star, dar fără să pună problema 
reprezentativităţii (Droesbeke et al., 1987, p. 14). În istorie însă au intrat anchetele 
din anul 1936, realizate de diverse jurnale americane în preajma alegerilor 
prezidenţiale. Două rezultate au atras atenţia: Literary Digest, care, realizând un 
sondaj de presă pe un eşantion de peste 2 mil. de persoane, a prezis câştigarea 
alegerilor de către candidatul A. Landon, şi institutul de sondaje al lui G. Gallup, 
care, după o metodă de sondaj raţionat, pe un eşantion mic, a prezis câştigarea 
alegerilor de către Roosevelt. Deşi sondajul realizat de Literary Digest a avut la 
bază un eşantion de volum mare, rezultatele au fost departe de adevăr, eşantionul 
fiind nereprezentativ (erori de sondaj semnificative). Practica anchetelor realizate 
de diverse jurnale s-a extins din Statele Unite ale Americii în Europa, la începutul 
secolului al XX-lea, devenind o modalitate de consultare a opiniei populaţiei 
privind viaţa politică și socială. În paralel cu activitatea ziarelor, cercetarea pe bază 
de sondaj prinde contur la nivelul unor instituţii specializate sau al unor companii 
private care au ca obiectiv sondarea opiniei publice. 

Criza economică din Anglia, la sfârşitul secolului al XIX-lea, a determinat 
oficialitățile să studieze îndeaproape fenomenul sărăciei. Studiile engleze asupra 
sărăciei (Desrosieres, 2000, p. 272) şi asupra problemelor sociale ridicate de 
industrializare şi de concentrarea în oraşe au adus contribuţii majore privind 
clarificarea metodei statistice de cercetare prin sondaj. Pe lângă alte aspecte, aceste 
studii au pus problema măsurării erorilor care apar în anchetele statistice, precum și 
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a utilizării teoriei probabilităților în rezolvarea unor asemenea probleme 
metodologice. 

Dezvoltarea pieţelor naţionale, datorată revoluţiei industriale şi dezvoltării 
infrastructurii, a condus la o nevoie de cunoaştere a proceselor din cadrul vieţii 
economice. Această nevoie trimite la dezvoltarea metodelor de cercetare a pieţei. 
În același timp, posibilitatea de a cunoaşte rezultatele de pe piaţă prin sondaje 
impune o standardizare a produselor pe piaţa naţională. Acest mecanism va 
continua să se dezvolte permanent: realitatea socio-economică ridică mereu 
probleme care stimulează știința să aducă soluţii în privinţa dezvoltării celor mai 
eficiente modalităţi de cunoaştere a acesteia; în egală măsură, nevoia de cunoaştere 
a complexităţii realităţii a condus la soluţii practice în plan economic şi social care 
să ţină cont de această nevoie şi să faciliteze acest proces. Începând cu prima parte 
a secolului al XX-lea se dezvoltă primele firme specializate în realizarea de studii 
de marketing. Între pionierii care au dus la dezvoltarea conceptului de cercetare de 
piață pe bază de sondaj se află şi George Gallup, cel care a pus bazele celebrei 
companii ce îi poartă numele. 


1.1.3. Opţiunea între sondaj şi cercetarea exhaustivă 


Este larg acceptat faptul că sondajul statistic şi-a câştigat locul aproape 
privilegiat în rândul metodelor de cercetare cantitativă atât în cadrul instituţiei 
oficiale de statistică, cât și în universități şi instituţii de cercetare, în companii și 
firme de producţie şi servicii. Analizând procesul prin care sondajul s-a impus ca o 
metodă științifică de cercetare de succes, putem delimita o serie de criterii care 
susţin opţiunea pentru metoda selectivă în raport cu cea exhaustivă. Prezentăm mai 
jos câteva dintre aceste criterii. 


a. Tema de cercetare 


În comparație cu cercetarea exhaustivă, prin sondaje se pot studia cu succes 
re cele mai diverse şi din domenii unde studiul întregii populaţii nu_se 


mere et 






teme 
poate realiza decât în condiţii limitate sau este chiar imposibil de aplicat. Există 
subiecte sau teme de cercetare care nu pot fi studiate decât prin apelul la sondajul 
statistic. Un exemplu îl reprezintă opinia populaţiei cu privire la opțiunea politică 
sau cu privire la o problemă socială sau economică] De asemenea, comportamentul 
şi consumul populaţiei în contextul economiilor de piaţă reprezintă un alt exemplu. 

ste destul de clar că nu pot fi intervievate toate persoanele dintr-o anumită țară, 

giune sau chiar localitate pentru a obţine informaţiile dorite pentru asemenca 
subiecte de mare interes) Un alt exemplu îl constituie studiile privind calitatea 
produselor obținute înieal companie (aici un caz limită îl reprezintă situaţia în care 
cercetarea presupune chiar scoaterea din uz a produselor verificate). 
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_b. Obiectivele propuse 

] În cercetarea prin sondaj se pot realiza studii analitice ale fenomenelor, cu 
posibilitatea stabilirii unor legi, modele şi previziuni, ceea ce nu e cazul unei 
cercetări exhaustive, care rămâne, cel mai adesea, la stadiul descriptiv. Dincolo de 
limitele impuse de cercetarea cantitativă, sondajele statistice oferă oportunitatea de 
a evalua empiric teoriile formulate de specialiştii din diverse domenii ale 
cunoaşterii, de a explora noi probleme și de a formula noi ipoteze, de a asigura 
suportul pentru luarea deciziilor ete. | 


c. Costul şi timpul de realizare a cercetării 

! În cercetările statistice, o constrângere importantă o reprezintă costul. Deşi 
costul cercetării pe unitate statistică este superior într-o cercetare prin sondaj, pe 
ansamblu, costul unui sondaj este mult inferior costului unei cercetări exhaustive. 
Realizarea periodică a studiilor prin sondaj conduce însă la o scădere a costului 
unitar de până la două sau trei ori, pentru că se utilizează logistica şi informaţiile 
anterioare. În această situaţie, unele anchete prin sondaj se pot realiza într-un timp 
foarte scurt, ceea ce reprezintă un aport substanţial al sondajului în condiţiile 
actuale de piaţă. Apelul la anchetele permanente (de tip panel) este o soluţie extrem 
de productivă, atât în privinţa rapidităţii şi actualităţii datelor, precum şi a SI 


d. Precizia 

Realizate pe un număr restrâns de cazuri, sondajele pot permite o rigoare 
înaltă Cu privire la calitatea activităţilor desfăşurate. În realizarea sondajului, de la 
etapa de observare şi până la întocmirea raportului, pot lucra persoane specializate, 
cu competenţe bine definite. Ca rezultat, calitatea muncii şi precizia rezultatelor 
sondajului sunt superioare recensământului. În aceeaşi ordine de idei se înscriu şi! 
posibilitatea realizării de pre-anchete care să pregătească cercetarea prin sondaj; 
realizarea de post-anchete care să realizeze controlul rezultatelor; posibilitatea 
stimulării financiare sau materiale a persoanelor anchetate astfel încât să ofere date 
corecte; posibilitatea unui control riguros al datelor înregistrate; posibilitatea 
ameliorării calității rezultatelor et 


ua. Limite ale utilizării sondajelor 


Ca metodă de cercetare ştiinţifică, sondajul admite o serie de limite și 
necesită o serie de condiţii de aplicare specifice. Prezentăm succint câteva aspecte 
din această arie tematică. | 

| a. Posibilitatea de a asigura reprezentativitatea eșantionului reprezintă piatra 
de încercare în organizarea anchetelor prin sondaj. Cercetările prin sondaj statistic 
nu pot fi aplicate decât în cazul în care această proprietate este îndeplinită. Această 
condiţie impune existenţa unor condiţii preliminare, cum ar fi: o bază de date cu 
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elemente de identificare pentru toate unităţile populaţiei; informaţii despre 
structura şi omogenitatea populaţiei; informaţii din studii anterioare; criterii și 
caracteristici care asigură o corespondenţă clară între populație şi eșantion etc. În 
practică, deseori este dificil de asigurat condiţia de reprezentativitate a 
eșantionului, iar soluţiile la această problemă determină alegerea unei anumite 
metode de sondaj, a unui nivel de precizie a rezultatelor, o anumită perioadă de 
timp de realizare sau un anumit cost al cercetării. Pentru o populaţie reală, care, în 
general, este una complexă, erorile de reprezentativitate sunt dificil de evaluat, iar 
proprietatea de reprezentativitate nu este uşor de asigurat. 

bi Costurile, dar mai ales rigorile metodologice cerute de anumite metode de 
sondaj (cum ar fi cazul sondajelor aleatoare) sunt uneori semnificative şi nu pot fi 
îndeplinite în totalitate. Acest lucru determină opţiunea pentru alte tipuri de sondaj 
decât cele așteptate (sondaje empirice, de exemplu, ale căror rezultate nu pot fi 
apreciate prin măsurători statistice sub aspectul preciziei) sau decizia de a aplica 
alte metode de analiză, cum ar fi cele calitative (de exemplu, interviuri)._| 

c.] Cu toate facilităţile unui sondaj, analiza în profunzime a unui fenomen nu 
este posibilă decât prin intermediul monografiilor (ca studii multidisciplinare şi 
exhaustive a realităţii) sau a cercetărilor calitative. Sondajul permite o analiză a 
care presupune măsurarea şi evaluarea numerică. La acest punct, literatura de 
specialitate ne arată că taberele sunt împărţite, existând opinii pro şi contra, studii 
teoretice şi metodologice cu privire la abordarea cantitativă, în special la limitele 
de cunoaştere ale acesteia. 

d.Rezultatele sondajului depind în mare măsură de calitatea răspunsurilor 
persoanelor anchetate. Atât mediatizarea anchetei în ce priveşte justificarea 
caracterului ştiinţific şi interesul practic ale sondajului, precum şi asigurarea 
condiţiilor de observare statistică sunt probleme delicate de care depinde calitatea 
rezultatelor. În măsura în care cercetările prin sondaj acordă o mare atenţie etapei 
de pregătire a anchetei şi apoi celei de culegere a datelor, rezultatele corespund 
realităţii. Dacă se neglijează calitatea procesului de culegere a datelor, atunci 
rezultatele pot suferi semnificativ. În aceeaşi ordine de idei, pentru a asigura o 
calitate ridicată a rezultatelor este nevoie de un personal specializat, bine pregătit, 
nu numai în pregătirea teoretică şi metodologică a anchetei, ci și în pregătirea 
etapei de culegere a datelor. 

e. VSelecţia efectivă “a unităţilor din populaţie nu este uşor de realizat, 
indiferent de metoda de sondaj aplicată. În practică, cel mai frecvent trebuie 
gestionată problema non-răspunsurilor. Pentru sondajele aleatoare sau mixte, 
unităţile nu sunt interschimbabile, fapt ce impune o supradimensionare prealabilă a 
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eşantionului pentru a asigura la final numărul necesar de unități în eşantion. În 
cazul sondajelor empirice, unităţile pot fi înlocuite, iar procesul de selecție 
presupune un efort mai mare şi cu mai multe riscuri de a realiza erori de 
reprezentativitate._] 


1.2. Conceptul de reprezentativitate a unui sondaj 


- În cercetările pe bază de sondaj statistic, asigurarea reprezentativităţii! 
eşantionului constituie cel mai important criteriu de fundamentare teoretică şi 
metodologică. În esenţă, conceptul de reprezentativitate statistică pune următoarea 
problemă: în ce condiţii partea sau eşantionul poate (re)prezenta, înlocui întregul 
sau populația totală din care a fost extras? La această problemă s-au dat diferite 
soluţii, conceptul de reprezentativitate suportând o evoluţie semantică în strânsă 
legătură cu dezvoltarea problemelor teoretice şi practice ale cercetării statistice. 

Reprezentativitatea a fost definită în principal de pe două poziţii. O primă 
abordare este de tip empiric, intuitiv, conceptul fiind definit în acord cu modul de 
manifestare a realităţii ca întreg, pe baza informaţiilor disponibile despre acest 
întreg. Cea de-a doua abordare a conceptului este de tip teoretic, pe baza unui set 
de principii şi legi care permit definirea şi extragerea unui eşantion din populaţie. 
Această poziţie s-a dezvoltat graţie aparatului oferit de teoria probabilităților şi de 
statistica matematică. Prezentăm pe scurt câteva elemente mai semnificative pentru 
fiecare tip de abordare. 


1.2.1. Elaborări empirice 


Așa cum am arătat în subcapitolul anterior, tentativele de formalizare a unui 
suport logic și ştiinţific pentru cercetările pe bază de sondaj datează din perioada 
secolelor XIV-XVII. Aceste rezultate vor cunoaşte însă o dezvoltare de amploare şi 
pe baze ştiinţifice riguroase abia la începutul secolului al XX-lea, într-o perioadă 
determinată de factori politici, economici şi ştiinţifici favorabili. Până atunci, însă, 
cercetările prin sondaj se realizează într-un cadru restrâns şi pe baze empirice, 
intuitive. Două modalități de definire a reprezentativităţii sau de justificare a 
cercetărilor prin sondaj rețin atenţia în perioada secolelor XVIII-XIX: reprezentativ 
înseamnă tipic şi reprezentativ înseamnă a păstra structura întregului la nivelul 
părții sau al eşantionului. 


! Se reia în acest subcapitol, cu anumite modificări, studiul „Conceptul de reprezentativitate în 
cercetarea statistică”, publicat de autor în Analele Univiversităţii „Al.1. Cuza ” din laşi, Tomul L/LI, 


2004/2005, pp. 413-418. 


= Sondajul statistic 
a. Reprezentativ - tipic 

ÎL În cea mai mare parte a anchetelor parţiale şi a monografiilor secolelor 
XVIII-XIX, reprezentativ înseamnă fipic (Desrosieres, 2000, p. 266). În această 
situaţie, reprezentativitatea este asigurată prin găsirea uneia sau a mai multor 
unități tip din populaţie. Unităţile tip reprezintă acele unităţi care au valorile 
variabilelor studiate foarte aproape de medie. Justificarea acestei abordări este una 
intuitivă. Dacă întregul este descris cu ajutorul mărimilor medii, atunci e suficient 
să se studieze acele unităţi din populaţie ale căror caracteristici se apropie de 
medie. 

Unităţile tip sunt alese cu grijă, pe baza datelor obţinute în anchetele 
exhaustive. Din datele statistice oficiale se obţin informaţii cu privire la populaţia 
de referinţă, se obțin mărimile medii pentru caracteristicile de interes, iar pe baza 
acestor informaţii se identifică unităţile care vor fi supuse studiului monografic, 
unei analize în profunzime. Specificul anchetei monografice este calitatea, studiul 
complex, multilateral al unităţilor tip alese din populaţie. 

__Critica adusă acestui mod de a defini reprezentativitatea constă, în principal, 
în aceea că prin analiza unităţilor tip nu se ţine cont de diversitatea populaţiei, de 
structura acesteia după diferite criterii (Desrosieres, 2000, p. 279). 





d 


b. Reprezentativ - miniatură a întregului 

Condiţia de reprezentativitate impune să se obţină un eşantion care să 
respecte structura populaţiei de referință şi, implicit, diversitatea existentă la 
nivelul acesteia. Când structura întregului este cunoscută, eşantionarea se poate 
realiza utilizând această informaţie, iar eşantionul apare ca o miniatură a populaţiei 
totale. Aceasta este viziunea despre reprezentativitate promovată de statisticianul 
norvegian N.A. Kiaer. La Congresul Institutului Internaţional de Statistică din 
1895, de la Berna, Kiaer readuce în lumea statisticii internaţionale discuţia asupra 
problemei sondajului (Kiaer, 1895, pp. 176-178). Autorul pune problema 
reprezentativităţii astfel: cum să obţii un număr de unităţi dintr-un întreg astfel 
încât acesta să (reprezinte în miniatură, cât mai fidel, colectivitatea totală. 
Criticând abordarea conceptului în contextul anchetelor din secolele XVII-XIX, 
Kiaer consideră că o anchetă reprezentativă trebuie să ia în considerare nu doar 
cazurile tipice, ci varietatea care se găseşte într-un anumit spaţiu social, propunând 
ca în sondaj să se realizeze o miniatură a acelui spaţiu sau țări. Organizarea de 
anchete reprezentative în Norvegia (mobilul practic) a fost motivată de interesul 
statului cu privire la politicile de protecţie socială şi cu privire la necesitatea creării 
de organisme în acest sens. 

Prin Kiaer, se realizează o trecere de la statistica întregului, caracterizată prin 
medie (Quetelet, 1835), la statistica analizei distribuţiei indivizilor, o statistică 
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bazată pe varianţă, corelaţie, comparaţie. Kiaer afirmă că totalul nu este dat de 
cazul tip, de medie, ci de toată varietatea cazurilor care se întâlnesc în viaţă. Însă 
abordarea lui Kiaer este mai mult intuitivă şi empirică. El este un bun cunoscător al 
muncii de teren, al realizării practice a anchetelor, fiind mai puţin preocupat de 
formalizarea matematică şi teoretică a metodei sale. În ciuda acestei lipse de 
preocupări pentru formalizare, discuţiile deschise de Kiaer sunt fundamentale, de 
pionierat. Kiaer nu a pus problema modului de extragere (aleatoare sau de alt tip) a 
unui eşantion, ci a sugerat modul în care se poate verifica reprezentativitatea, după 
metoda variabilelor de control. Rezultatele obţinute pentru aceste variabile sunt 
comparate cu cele obţinute prin recensământ. Dacă abaterile nu sunt semnificative, 
atunci rezultatele anchetei prin sondaj sunt considerate valide. 

Puterea cognitivă a cercetării prin sondaj propusă de Kiaer se poate evidenția 
în comparaţie cu metodele clasice: recensământul şi monografia. Faţă de 
recensământ, sondajul se impune prin două elemente specifice: posibilităţile de 
cunoaştere şi precizia. Dacă prin recensământ realitatea este analizată la suprafaţă, 
metoda reprezentativă permite un studiu în profunzime al realităţii. În primul caz, 
informaţiile obţinute sunt descriptive, pe când, în al doilea caz, acestea permit 
explicarea realității supuse cercetării. În plus, metoda reprezentativă este mai 
precisă, rezultatele fiind afectate de mai puţine erori. Atât sondajul, cât şi 
monografia analizează în profunzime realitatea, însă monografia se rezumă la 
cazurile tipice, pe când sondajul studiază întreaga diversitate a populaţiei. 

Valoarea ştiinţifică a cercetării prin sondaj depinde de caracterul 
reprezentativ al eşantionului şi mai puţin de volumul acestuia. Deseori se întâmplă 
ca datele disponibile sau practic uşor de obţinut să nu se refere decât la o parte a 
populaţiei. A realiza o cercetare doar pe baza acestor date înseamnă a comite o 
eroare de reprezentativitate. Or, o eroare de acest tip au comis americanii în 
anchetele de opinie prin mass-media, mizând pe un volum mare de date, dar fără a 
cunoaşte gradul lor de reprezentativitate. 


1.2.2. Elaborări ştiinţifice 


Cu toate realizările lui Kiaer, metoda reprezentativă va pătrunde cu greu atât 
în teoria, cât şi în practica statistică. O primă cauză este de ordin teoretic: metoda 
lui Kiaer rămâne una intuitivă şi empirică, nu are un fundament ştiinţific, 
matematic. Deschiderea se realizează câţiva ani mai târziu prin utilizarea 
distribuţiilor de probabilitate la extragerea unui eşantion şi la compararea 
rezultatelor de sondaj cu cele de la nivelul întregii populaţii. O altă cauză a 
demarajului greoi al metodei sondajului statistic este dată de reținerea comunităţii 
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ştiinţifice cu privire la sondaj, sub impactul și influenţa administraţiei şi statisticii 
oficiale, bine înrădăcinate în tradiţia recensămintelor. 

După anul 1925, când are loc Congresul Institutului Internaţional de 
Statistică de la Roma, se apreciază că metoda reprezentativă este validă, iar 
problemele care se deschid ţin de modalităţile de obţinere a unui eşantion din 
populaţia totală. Pe baza rezultatelor obţinute de specialişti în prima parte a 
secolului al XX-lea, conceptul de reprezentativitate a fost definit, în sens restrâns, 
în legătură cu procedeele aleatoare sau mixte de extragere a unui eşantion. În acest 
cadru, se remarcă următoarele corelaţii conceptuale: reprezentativ-aleator, 
reprezentativ-precis, reprezentativ-stratificat. 


a. Reprezentativ-aleator 

În plan teoretic, abordarea relaţiei eşantion-populaţie cu ajutorul 
instrumentelor oferite de teoria selecţiei determină o altă accepţiune asupra 
reprezentativităţii. În acest caz, reprezentativ înseamnă să extragi eşantionul după 
modelul unei experienţe aleatoare, după o schemă probabilistă, caz în care fiecare 
unitate din populaţie are o probabilitate cunoscută de a intra în eşantion. 
Reprezentativitatea este garantată de principiul extragerii aleatoare, adică după un 
principiu care asigură calculul probabilității de includere a unei unități în eșantion. 
De exemplu, sondajul aleator simplu asigură fiecărei unităţi din populaţie aceeași 
şansă de a intra în eșantion, ceea ce înseamnă că eșantionul extras va reprezenta 
populaţia. Schema de extragere probabilistă permite, de asemenea, calculul unui 
volum al eşantionului care nu numai că este reprezentativ, ci asigură şi un anumit 
grad de precizie așteptat. 


b. Reprezentativ-precis 

Dezvoltările din teoria probabilităților şi statistica matematică au permis 
determinarea unui tip de erori care însoțesc cercetarea prin sondaj statistic, şi 
anume erorile de reprezentativitate. Aceste erori reprezintă măsuri care iau în 
calcul diferenţele dintre valorile de sondaj (estimaţii) calculate la nivelul unui 
eşantion şi parametrii populaţiei din care a fost extras eşantionul. Cu cât erorile de 
reprezentativitate sunt mai mari, cu atât este afectată reprezentativitatea 
rezultatelor. În acest caz, reprezentativitatea statistică înseamnă obţinerea celor mai 
bune estimaţii sau rezultatelor cu erorile cele mai mici. Un eşantion este considerat 
reprezentativ dacă pentru o variabilă dată estimează valoarea adevărată sau 
parametrul cu o eroare minimă, adică cu eroare zero (Ardilly, 1994, p. 388). 


c. Reprezentativ-stratificat 
Fundamentarea reprezentativităţii statistice a suportat o nouă clarificare prin 
combinarea celor două posibilităţi de a obţine un eșantion: cea empirică şi cea 
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probabilistă. Utilizând informaţiile despre existența unor categorii diferite de 
unităţi în populaţia totală, pe de o parte, şi fundamentul matematic al extragerii 
aleatoare, pe de altă parte, J. Neyman elaborează metoda sondajului stratificat. 
Autorul arată superioritatea unui sondaj aleator faţă de unul raţionat, nealeator, 
precum şi posibilitatea de a ameliora rezultatele sondajului aleator printr-o 
stratificare a priori a populaţiei totale (Neyman, 1934, pp. 558-606). Obţinerea 
reprezentativităţii în cazul unui sondaj stratificat reclamă două exigenţe: 

- construirea de nomenclatoare, clase care să asigure o stratificare a priori a 
populaţiei totale după variabile care asigură diferențe semnificative între 
indivizii din clase diferite şi diferenţe cât mai mici între indivizii din aceeaşi 
clasă; 

- construirea schemelor de extragere aleatoare din aceste clase a indivizilor şi 
definirea instrumentelor care să verifice gradul de reprezentativitate a 
rezultatelor obţinute (instrumente specifice statisticii inferenţiale). 

În cazul sondajului stratificat, există mai multe posibilităţi de construire a 
eşantionului: din fiecare strat să se aloce acelaşi număr de unităţi, un număr 
proporţional de unităţi cu ponderea stratului din total sau un număr de unităţi care 
să ţină cont nu numai de pondere, ci şi de gradul de omogenitate al fiecărui strat 
(alocare optimală). Eşantionul obţinut prin stratificare, cu o alocare proporţională a 
unităţilor din fiecare strat, este numit eșantion reprezentativ, iar alocarea optimală 
mai poartă şi numele de alocare Neyman. 


Concluzie 

Conceptul de eşantion reprezentativ se referă la proprietatea fundamentală a 
unui eșantion de a permite descrierea şi explicarea populaţiei din care a fost extras 
în condiţii de calitate cunoscute. Aceasta este condiţia de bază a valabilităţii 
ştiinţifice a unei colectivități de selecţie (Bărbat, 1971, p. 436). Celor două 
modalități de abordare a conceptului de reprezentativitate le corespund două 
metode de cercetare prin sondaj distincte: metode raţionate sau empirice (sondajul 
pe cote, metoda unităţilor tip etc.) şi metode aleatoare. Prin combinarea celor două 
metode fundamentale, a rezultat un tip de sondaj mixt, care utilizează avantajele 
ambelor metode de sondaj (cazul sondajului stratificat, de exemplu). 

Definirea reprezentativităţii unui eşantion se poate face atât în sens restrâns, 
cât şi în sens larg: 

- în sens restrâns, un eşantion este reprezentativ dacă fiecare unitate din 

populaţie are posibilitatea de a intra în eşantion cu o probabilitate cunoscută. 

Cu alte cuvinte, este reprezentativ eșantionul care este extras după o metodă 

aleatoare. Definiţia se extinde şi la eșantioanele mixte, care implică o 

dimensiune aleatoare în procesul de selecţie; 
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- în sens larg, un eşantion este reprezentativ dacă permite descrierea şi 
explicarea populaţiei de referință cu erori cât mai mici. Potrivit acestei 
accepţiuni, reprezentativitatea poate fi extinsă şi la eşantioane obţinute după 
metode de sondaj nealeatoare. 

Problema reprezentativităţii eşantionului este esenţială într-un sondaj 
statistic, însă rămâne o problemă sensibilă şi dificil de rezolvat. În practică, de 
regulă, reprezentativitatea unui eşantion se defineşte în raport cu o singură 
variabilă, cu o variabilă fundamentală pentru tema de cercetare. Problema practică 
cea mai dificilă este că nimic nu garantează faptul că eşantionul este reprezentativ 
şi în raport cu o altă variabilă, mai ales în cazul în care prin sondaj se cercetează o 
problemă complexă. O soluţie, pentru asigurarea reprezentativităţii eşantionului, 
este să se organizeze cercetări pe teme bine conturate, iar variabila prin care se 
defineşte reprezentativitatea să fie puternic corelată cu variabilele care apar în 
studiu. În cazul problemelor complexe se recomandă descompunerea problemei pe 
componente care pot face obiectul unor cercetări separate. În fundamentarea 
reprezentativităţii unui eşantion, pe lângă problemele care țin de metoda de sondaj, 
esenţiale sunt şi elementele care ţin de: definirea populaţiei de referinţă sau a 
întregului, definirea unităţilor individuale de selecţie şi de observare, definirea 
caracteristicilor populaţiei după care se realizează cercetarea etc. 


1.3. Probleme teoretice şi metodologice 


În literatura de specialitate, etapele unei cercetări prin sondaj sunt prezentate 
în diverse forme, mai sintetic sau mai analitic. Lucrările clasice de sondaje prezintă 
câteva etape preliminare celei de culegere a datelor, cum ar fi: definirea 
obiectivelor cercetării, a populaţiei şi a datelor ce trebuie culese, identificarea 
informaţiei deja existente etc. (Cochran, 1997, p. 5; Droesbeke, 1997, p. 18). În 
această lucrare preferăm o abordare care consideră ca primă etapă a cercetării 
definirea problemei sau a temei de cercetare, utilizând o analitică ce nu este 
specifică lucrărilor cu privire la sondajul statistic. Preferăm să analizăm detaliat 
această primă etapă utilizând logica propusă în lucrările de metodologia cercetării 
din ştiinţele sociale, care pun accent pe etapa de fundamentare a temei de cercetare. 

Etapele unei cercetări statistice bazate pe sondaj sunt prezentate schematic în 
Figura 1.]. În această schemă, după prima etapă a cercetării, putem delimita două 
tipuri de probleme care trebuie rezolvate în contextul realizării unui sondaj. Pe de o 
parte, vorbim despre problemele de ordin metodologic, surprinse în etapa elaborării 
planului de sondaj. Pe de altă parte, este vorba despre o serie de probleme de ordin 
organizatoric ce privesc elementele de realizare efectivă a cercetării. Conceperea 
chestionarului statistic este considerată o etapă distinctă în unele abordări, deși 
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această etapă poate fi asociată cu cea a formulării temei de cercetare. În mod logic, 
chestionarul se construiește după ce au fost definite toate instrumentele conceptuale 
şi metodologice ce vor fi utilizate în anchetă, inclusiv obiectivele şi ipotezele de 
cercetare. Cu privire la elaborarea chestionarului, utilizăm o abordare proprie care 
face apel la trei dimensiuni de analiză: arhitectural (tehnici de construcţie şi 
elemente de structură); de conţinut (tipologia întrebărilor şi probleme specifice de 
elaborare); de impact (forma, problemele legate de editare). 


Definire 
problemă 
















Elaborare 
chestionar 


Plan de 
sondaj 





Organizare 


Culegere 
date 


Prelucrare 
şi analiză 





Raport 
final 


Figura 1.1. Demersul metodologic al cercetării prin sondaj 


Asupra etapei de culegere a datelor nu insistăm, ci analizăm în treacăt câteva 
aspecte în prelungirea celei de construire a chestionarului. Ultimele două etape ale 
demersului metodologic sunt la fel de importante, însă nu vor fi abordate în 
lucrarea de față. De regulă, metodele de analiză a datelor sunt tratate în lucrări de 
statistică specifice, iar etapa de elaborare a raportului de cercetare se prezintă 
detaliat în lucrări de metodologia cercetării. 

Dintre probleme teoretice și metodologice, în această lucrare tratăm pe scurt 
câteva aspecte privitoare la definirea temei de cercetare, elaborarea chestionarului 
şi elaborarea unui plan de sondaj. În partea finală a acestui subcapitol analizăm 
câteva aspecte privind organizarea unui sondaj statistic, cu accent pe elaborarea 
unui buget și a unei diagrame privind încadrarea în timp a activităţilor ce presupun 
realizarea sondajului. 
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1.3.1. Definirea temei de cercetare 


Tema de cercetare reprezintă, de regulă, un construct conceptual care apare 
la finalul unui proces care ar putea cuprinde mai multe etape: analiza cererii de 
sondaj, delimitarea fenomenului real, explorarea, conceptualizarea, construirea 
unui model de analiză (pentru diverse elemente care ar putea privi această etapă, a 
se vedea Quivi şi Campenhoudt, 1995, p. 16; Mouton şi Marais, 1990, p. 51). 
Prezentăm, pe rând, câteva aspecte pentru fiecare etapă în parte. 


a. Analiza cererii de sondaj 

Sondajele statistice sunt organizate ca urmare a unor nevoi reale de 
informaţii ce provin fie din partea administraţiei, fie din partea unor actori sociali şi 
economici (companii private, instituţii  non-guvernamentale, instituții de 
învăţământ şi cercetare etc.). Asemenea nevoi de informaţii ce pot fi obţinute prin 
anchete statistice se sistematizează în cereri de cercetare prin sondaj. Cererile 
formulate de destinatarii sondajelor cuprind o serie de obiective ce pot fi formulate 
în diverse variante, de la solicitări clar definite şi precis formalizate până la 
obiective prezentate mai puţin precis, în termeni neștiinţifici sau uneori neclari. 

O primă imagine asupra temei de cercetare se obţine prin analiza acestei 
cereri de sondaj pusă la dispoziţie de instituţia sau persoana care solicită efectuarea 
anchetei. În acest sens, este important să existe un dialog între echipa de cercetători 
şi destinatarii studiului, pentru a identifica scopul principal al sondajului și modul 
în care vor fi concretizate rezultatele. Cerinţele concrete formulate de clientul care 
comandă sondajul pot permite creionarea primelor coordonate ale temei de 
cercetare: 

— nivelul ştiinţific al cercetării (descriptiv - care prezintă sintetic elementele 
esenţiale ale realităţii observate, explorator - care poate propune noi ipoteze 
şi teorii, evaluativ - care verifică ipoteze existente, explicativ - care identifică 
factori determinanți, legi şi modele, predictiv - care oferă informaţii despre 
fenomenul analizat în contexte noi); 

— persoanele care trebuie intervievate şi eventual o serie de caracteristici de 
interes ale acestora; 

_ aria de investigaţie sau spaţiul geografic care dimensionează problema; 

— tipuri de date care trebuie culese în contextul anchetei; 

— alte informaţii. 


Exemplu 

Considerăm un exemplu frecvent întâlnit, precum cel al situaţiei unui 
candidat la primăria unui oraş A ce dorește să afle informaţii referitoare la 
receptarea activităţii sale în rândul cetăţenilor şi ce șanse are la următoarele alegeri. 

În cererea de sondaj, destinatarul ar putea menţiona că dorește să afle: 
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— gradul de cunoaştere a proiectului său electoral în rândul alegătorilor; 

— care este opinia cetăţenilor cu privire la rezultatele activităţii sale de primar 
în diverse domenii; 

— care este sprijinul de care se bucură pentru un nou mandat; 

— profilul alegătorilor care îl susțin și al celor care sunt împotriva sa; 

— obiecțiile celor care au decis că nu îl votează; 

— ce anume consideră cetăţenii că reprezintă priorităţile administrative pentru 
viitorul mandat; 

— care este profilul primarului dorit de comunitate; 

— etc. 


Analiza cererii de sondaj ne poate permite sublinierea concluziei că avem de 
a face, în esență, cu un studiu descriptiv care poate admite nuanţe explorative și, în 
final, se rezumă la extrapolarea unei informații cantitative de la nivelul eșantionului 
la nivelul populaţiei de referință (estimarea unor parametri). Este destul de clar că 
persoanele care participă la anchetă sunt reprezentate de cetăţenii localităţii A cu 
drept de vot (persoanele cu domiciliul stabil în acea localitate şi cu vârsta de 18 ani 
și peste). 


b. Delimitarea naturii fenomenului real 

În demersul elaborării temei de cercetare, un aspect esenţial îl reprezintă 
identificarea registrului de realitate la care face trimitere problema supusă analizei: 
un fenomen natural, social sau economic, o clasă de obiecte sau de procese, 
comportamentul unei categorii de persoane etc. În aceeaşi ordine de idei, potrivit 
metodei statisticii, fenomenele şi procesele reale analizate sunt observate ca 
întreguri structurale organizate sub formă de colectivităţi. Pe lângă acest specific al 
cercetării statistice, trebuie subliniat cel al cercetării prin sondaj. Culegerea datelor 
privind realitatea studiată se realizează de la nivelul unei populaţii umane care 
participă la un interviu şi care trebuie definită în această etapă a cercetării. Uneori 
cele două populaţii coincid, adică persoanele intervievate sunt direct participante la 
realitatea supusă analizei, alteori unităţile intervievate sunt doar furnizoare de 
informaţii și au un rol pasiv în raport cu tema studiată. 

În etapa de pregătire a sondajului, cu privire la fenomenul studiat, este 
necesar să se stabilească o serie de elemente care să asigure corespondenţa dintre 
realitatea studiată, populaţia statistică definită pe baza acesteia și populaţia ce 
participă efectiv la selecţia şi colectarea datelor: 

— natura Sau esența populației statistice corespunzătoare realităţii investigate. 

În practica cercetărilor statistice, vorbim despre colectivităţi de fapte, 

evenimente, opinii, obiecte, procese, fenomene, indivizi, grupuri, organizaţii 

etc. În fiecare caz, în funcţie de tema studiată, se identifică o caracteristică 
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care defineşte natura populaţiei și pe care o au toate unităţile (de exemplu, 
calitatea de consumator al unui produs sau cea de cetăţean al unei țări); 

— în paralel cu identificarea naturii populaţiei statistice analizate, se definește 
populația de respondenţi care participă la selecția şi culegerea datelor. Din 
perspectiva culegerii datelor, unitățile individuale ale acestei populaţii pot fi 
simple (un angajat al unei companii) sau complexe (o companie), active (un 
cetăţean cu drept de vot) sau pasive (un copil al unei familii pentru care 
raportează date unul dintre părinți). În sondajele statistice, populaţia 
statistică cu care se lucrează este, în final, reprezentată de populaţia unităților 
care sunt supuse procesului de culegere a datelor, adică populația 
respondenţilor; 

— modul de manifestare a realității analizate. Cercetarea statistică se bazează 
pe observarea realităţii așa cum se manifestă concret, ceea ce presupune un 
efort de analiză a complexității problemei analizate, de detaliere a acesteia 
pe dimensiuni, componente, modalități de manifestare; 

— caracteristici ale populației supuse observării. Se identifică o serie de 
caracteristici ale unităților populaţiei respondenților care sunt relevante 
pentru tema de cercetare. Aceste caracteristici se grupează după natura lor, 
posibilităţile de observare sau de culegere a datelor etc; 

— durata şi spaţiul de manifestare (o perioadă de timp și arealul geografic la 
nivelul căruia se desfăşoară realitatea studiată). Există studii care se 
realizează ocazional, pentru un moment sau perioadă de timp (cross- 
sectional), dar există şi studii care se reiau cu regularitate (longitudinale sau 
panel). 


Exemplu 

Cererea de sondaj, prezentată mai sus, indică relativ uşor natura realității 
studiate, anume opinia populaţiei privind activitatea și profilul unui candidat la 
primăria unei localităţi. Potrivit dicționarului de sociologie, opinia este „un enunţ 
care dă expresie opțiunii cognitive şi afective a unei persoane, grup social sau 
colectivitate pentru un anumit punct de vedere cu privire la un fapt sau eveniment, 
o relaţie sau interacţiune socială” (Zamfir și Vlăsceanu, 1998, p. 402). În etapele 
ulterioare, se va realiza o analiză detaliată asupra conceptului de opinie şi a 
posibilităţilor de operaţionalizare pentru studiul propus în această anchetă. 

Deoarece opiniile supuse analizei sunt exprimate de cetățenii români cu 
drept de vot, din orașul A, cercetarea prin sondaj propusă are ca populaţie de 
respondenţi persoanele cu domiciliul stabil din localitatea de referință, cu vârsta de 
peste 18 ani şi cetățenie română. Natura populaţiei investigate este reprezentată de 
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această caracteristică de cetăţean român cu drept de vot, ceea ce implică o condiţie 
de vârstă (peste 18 ani). 

Pentru tema de cercetare, sunt relevante o serie de caracteristici ale acestei 
populaţii care sunt numite caracteristici socio-demografice: vârsta, genul, profesia, 
ocupaţia, domeniul de activitate, nivelul de educaţie, venitul, starea civilă, religia 
etc. 

De regulă, ancheta se realizează într-o perioadă de timp de câteva săptămâni, 
iar rezultatele vor avea acest referent temporal. De asemenea, fiind vorba despre un 
oraş, delimitarea spaţială se realizează prin apelul la această caracteristică 
administrativ teritorială, identificată la nivelul unităților populaţiei cu ajutorul 
domiciliului stabil ce figurează în actul de identitate. 


c. Explorarea 

Etapa exploratorie presupune efortul de plasare a temei de cercetare în 
contextul altor cercetări, al literaturii de specialitate care propune teorii și explicaţii 
asupra problemei studiate, dar şi o conectare a cercetătorilor ce realizează sondajul, 
direct sau indirect, cu realitatea supusă analizei. 

Această etapă presupune realizarea unor activităţi concrete de tipul: 
documentare, realizarea de interviuri exploratorii și apelul la alte metode de 
explorare a realităţii supuse cercetării. 


Documentarea 

Activitatea de documentare este esențială şi presupune un efort de cercetare 
a unor documente publicate şi accesibile cercetătorilor. Principalele documente şi 
surse de documentare sunt: 

— studii şi analize similare anterioare, care sunt publicate sub forma unor 
articole de specialitate sau rapoarte de cercetare. De cele mai multe ori, o 
anchetă prin sondaj nu reprezintă o noutate absolută, ci beneficiază de 
experiența altora. Din aceste studii se pot desprinde anumite direcţii de 
cercetare, ipoteze, concepte şi probleme conexe. Unele informaţii sunt utile 
pentru definirea eşantionului (de exemplu, o estimaţie a unui parametru) şi a 
instrumentului de culegere a datelor (chestionare utilizate în anchete 
similare), pentru stabilirea metodei de sondaj (ce metode au fost folosite 
anterior, ce informaţii asupra populaţiei au fost utilizate, ce costuri, ce volum 
al eşantionului etc.), iar altele, pentru definirea cât mai bună a temei de 
cercetare, a obiectivelor şi ipotezelor etc.; 

— lucrări de specialitate publicate sub formă de cărţi şi monografii care 
tratează problema studiată sau probleme similare și studii diseminate în 
reviste cu vizibilitate naţională şi internaţională. Aportul acestor lucrări este, 
în principal, de nivel teoretic şi metodologic. Printr-o documentare 
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minuțioasă, se pot desprinde teorii și abordări cu privire la tema studiată, 
precum și metode și tehnici utile în cercetare. Inventarul teoriilor, 
conceptelor, abordărilor se realizează structurat, pentru a putea fi folosite în 
etapa următoare; 
documentele oficiale ale diverselor instituţii ale statului sau instituții non- 
guvernamentale. O serie de date şi informaţii privitoare la populaţia de 
referință pot fi obţinute din documente oficiale, baze de date disponibile etc. 
Un exemplu tipic la care se apelează constant îl constituie instituţiile de 
statistică (la nivel regional, naţional sau internaţional). Acestea oferă date 
statistice oficiale importante pentru desfăşurarea anchetelor prin sondaj; 
alte documente ce pot fi disponibile la nivelul instituţiilor publice sau al celei 
care solicită ancheta. 
Ca tehnică de bază, documentarea presupune construirea unor fişe de lectură 
care sistematizează informaţia după mai multe criterii: concepte, teorii, definiţii de 
lucru, metode și metodologii, abordări, obiective şi ipoteze etc. 

Interviuri exploratorii 


Aceste interviuri ajută la conturarea problematicii cercetării, asigură 
contactul direct cu fenomenul studiat, ajută la identificarea unor ipoteze de lucru şi 
la clarificarea unor aspecte privind problema studiată (Quivi şi Van Campenhoudt, 
1995, p. 63). De regulă, pentru atingerea acestor obiective se aplică interviurile 
semi-structurate. În aceste interviuri se utilizează un ghid de interviu sub forma 
unui set minim de întrebări elaborate de cercetător, dar admite şi formularea unor 
întrebări noi, care se nasc în momentul dialogului. 

Interviurile exploratorii vizează obţinerea de informaţii cu privire la tema de 
cercetare de la cel puţin trei categorii de persoane care au un rol special prin poziția 
pe care o ocupă în raport cu tema. Mai întâi, sunt vizaţi specialiştii în domeniu, cei 
care au expertiza necesară cu privire la tema de cercetare (de la cercetători şi 
profesori până la specialiști care lucrează în companii, instituţii publice etc.). În al 
doilea rând, sunt intervievate persoane care sunt implicate direct în realitatea 
analizată și care cunosc foarte bine fenomenul studiat (sunt vizate persoane cheie, 
care cunosc foarte bine fenomenul studiat sau au competenţe şi pot realiza o 
analiză pertinentă). În al treilea rând, sunt vizate persoane care fac parte din 
publicul direct interesat de rezultatele anchetei (de la persoane care fac parte din 
instituţia care a comandat sondajul, până la cele din spaţiul public - media, instituţii 
de învățământ etc.). 

După realizarea interviurilor, are loc analiza acestora cu ajutorul metodei 


analizei de conţinut. Informaţiile obţinute sunt organizate pentru a servi etapelor 
următoare ale cercetării. 
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Metode exploratorii complementare 
Pentru a identifica noi aspecte cu privire la problema analizată, se pot aplica 
o serie de metode de explorare în plus (Quivi şi Van Campenhoudt, 1995, p. 78): 

— observare directă. Dacă tema o permite, membrii echipei de cercetare pot 
realiza o observare directă a realităţii studiate, o observare participativă. Cu 
această ocazie, sunt culese date și informaţii directe care sunt utilizate în 
etapele ulterioare; 

— consultarea unor documente speciale. Există cazuri în care, pentru definirea 
riguroasă a temei de cercetare, este necesar să se apeleze la o serie de 
documente tehnice, detaliate sau la altele mai speciale care nu fac parte din 
rândul celor întâlnite în biblioteci sau instituţii publice. Se pot încadra aici 
documente rare sau private care pot oferi informaţii particulare; 

— alte interviuri. În funcţie de nevoie, la interviurile exploratorii realizate deja 
se mai pot adăuga și altele, organizate punctual, cu persoane mai speciale 
sau cu subiecte bine delimitate. Cu această ocazie se pot verifica anumite 
informaţii culese sau se pot pune întrebări suplimentare. 


Exemplu 

Pentru ancheta propusă în acest capitol cu titlu didactic, etapa de 
documentare se realizează relativ ușor pentru că vorbim despre un sondaj cu o temă 
cunoscută şi care se realizează frecvent. Conceptele de opinie publică, în general, și 
cel de opinie politică, în particular, sunt studiate în lucrări de sociologie şi 
politologie, iar în aceste studii se pot identifica uşor dimensiunile conceptului, 
teorii explicative, factorii determinanțţi, instrumentele de măsurare etc. 

O sursă importantă de documentare o reprezintă studiile anterioare. Practica 
sondajelor de opinie este una curentă, iar informaţii despre metodologiile utilizate 
în aceste anchete, instrumentul de colectare a datelor (chestionarul statistic), 
obiectivele şi ipotezele de lucru, precum şi despre rezultatele obținute există în 
abundență. Etapa de documentare presupune fișarea și structurarea acestor 
informaţii pentru a fi utilizate cu uşurinţă în elaborarea propriei anchete. 

O altă sursă de documentare o reprezintă documentele oficiale din arhiva 
primăriei. Aceste documente sunt utile pentru a obţine informaţii despre populația 
de referinţă, precum şi date concrete despre activitatea primarului. 

Interviurile exploratorii se pot realiza cu un număr de cetățeni ai orașului, cu 
angajați ai primăriei, cu analiști politici şi ziariști. 

d. Conceptualizarea 

În această etapă, obiectivul principal este acela de a rezolva o serie de 
probleme punctuale privind abordarea teoretică cu care se va lucra asupra 
problemei de cercetat. Prin conceptualizare se poate înțelege etapa de analiză 
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conceptuală sau de analiză a conceptelor utilizate în cercetare și a teoriilor care 
privesc aceste concepte. Rezultatele obținute în etapa de explorare sunt utilizate 
aici pentru a evidenția: 


conceptele și ideile cheie ce privesc tema de cercetare; 

definițiile de lucru ale conceptelor utilizate, în special pentru conceptul de 
bază care defineşte tema de cercetare. Aceste definiţii conferă un anumit 
sens conceptelor utilizate și pot fi strict teoretice sau operaţionale; 
principalele teorii explicative utilizate în literatură pentru problema studiată. 
O teorie reprezintă un set de concepte, definiţii, enunțuri care oferă o 
explicație asupra realităţii analizate, având un grad mare de generalitate și 
putere predictivă. Într-o abordare critică, se evidenţiază plusurile şi 
minusurile fiecărei teorii, care sunt cel mai frecvent utilizate în cercetările 
anterioare, cum a fost definit obiectul cercetării în aceste studii, care ar fi 
abordarea cea mai potrivită pentru actuala cercetare şi de ce etc.; 

factorii determinanţi care permit explicarea fenomenului, împreună cu 
ipoteze asupra tipului de impact al acestora; 

elementele teoretice conexe cu tema; 

ipotezele de lucru întâlnite în diverse studii; 

obiectivele de cercetare formulate în studii similare; 

dificultăţile cercetării, problemele specifice, aspectele principale care 
definesc tema de cercetare etc. 

Etapa finală a acestei etape de conceptualizare presupune o opțiune teoretică 


în care să se precizeze clar: 


conceptul de bază şi alte concepte care susţin tema de cercetare; 

definițiile de lucru acceptate în cercetare pentru conceptele utilizate; 
orientarea teoretică aleasă: teoria cu care se lucrează în alegerea și definirea 
conceptelor cercetării; 

factorii determinanți şi criteriile de clasificare a acestora; 

modelele explicative cu care se va lucra (modele teoretice, analitice etc.). 
Modelele sunt reprezentări schematice și simplificate ale realității care au 
rolul să prezinte caracteristicile principale ale fenomenului studiat și relațiile 
dintre diverse elemente. 


Exemplu 
Din punct de vedere teoretic, realizarea unui sondaj care analizează opinia 


populaţiei privind activitatea unui primar și șansele de a fi ales din nou presupune o 
analiză conceptuală din domeniul teoriilor cu privire la opinia publică, în general, 
şi cea politică, în particular. Literatura de specialitate pentru acest domeniu este 
foarte bogată, iar multitudinea cercetărilor prin sondaj realizate deja poate 
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reprezenta un avantaj, după cum poate constitui și o dificultate în formularea 
propriei problematici. Nu este cazul să prezentăm aici detalii cu privire la o 
problematică de cercetare pentru opinia populaţiei. Câteva exemple care apar ca 
rezultate ale acestei etape şi modul cum sunt utilizate în cercetare vor fi prezentate 
în legătură cu etapa de construire a unui model de analiză. 


e. Construirea unui model de analiză sau a unui model de cercetare 

Aceasta este etapa finală de definire şi formalizare a temei de cercetare în 
care se concretizează întreaga muncă din etapele anterioare. Etapa presupune 
operaționalizarea conceptelor, definirea obiectivelor şi formularea ipotezelor 
cercetării prin sondaj, validarea instrumentelor construite (Quivi și Van 
Campenhoudt, 1995; Mouton şi Marais, 1990). 


Operaţionalizarea conceptelor 

Problemei supuse cercetării prin sondaj i se asociază un concepr, care 
reprezintă instrumentul teoretic de bază. Conceptul este o reprezentare cognitivă și 
simbolică a realităţii, un element produs prin abstractizare, ce fixează un anumit 
înțeles sau un conţinut informaţional și permite cercetătorului să creeze o relaţie cu 
realitatea supusă analizei. Pentru fiecare concept selectat se adoptă o definiţie de 
lucru care precizează conţinutul său informațional (definiție acceptată așa cum este 
prezentă în alte studii sau primind anumite nuanţe specifice abordării teoretice 
alese de cercetător). Prin munca de operaționalizare a conceptului de bază 
înțelegem efortul de a construi o serie de instrumente care să permită, în final, 
procesul de măsurare, adică observarea şi exprimarea numerică a realităţii studiate 
(Mouton și Marais, 1990, p. 64). Conform literaturii de specialitate, operaţiona- 
lizarea presupune identificarea principalelor dimensiuni ale conceptului de bază 
care instrumentează problema analizată; la nivelul fiecărei dimensiuni se identifică 
o serie de componente; pentru fiecare componentă se construiesc caracteristicile 
sau variabilele prin care se realizează efectiv măsurarea; în final, pe baza 
variabilelor, se definesc ifemii şi întrebările din chestionarul statistic. În etapa 
finală, pe baza chestionarului, se construiesc variabilele şi indicatorii statistici care 
reprezintă purtătorii finali de informaţie, instrumente cu ajutorul cărora se ating 
obiective precise ale cercetării. 

Dimensiunile conceptului. Un prim pas de trecere de la concept spre 
concretizarea procesului de măsurare îl reprezintă stabilirea dimensiunilor acestuia. 
Prin dimensiunile conceptului se identifică fenomene sau realități care apar ca 
elemente componente sau elemente de un grad mai redus de complexitate care se 
subsumează celei supuse analizei. Astfel, pentru conceptul de bază care definește 
tema de cercetare se identifică o structură conceptuală sau un set de concepte care 
se subsumează acestuia și care joacă rolul de a prelua o parte a problemei. Aceste 
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concepte cu un grad mai mic de generalitate poartă numele de dimensiuni şi asigură 
împreună o structură conceptuală coerentă pentru fenomenul analizat. Unele 
concepte de bază permit ușor o asemenea structură, fiind obţinute prin analiza 
modului de manifestare a fenomenului așa cum apare în realitate. De exemplu, 
pentru conceptele de educaţie, de venit se identifică uşor asemenea dimensiuni. 
Altele, însă, necesită o amplă dezbatere teoretică și admit mai multe posibilităţi de 
definire a dimensiunilor (de exemplu, conceptele de discriminare, violenţă, criză 
etc.). 

Componentele. Deseori, trecerea de la dimensiuni la elementele operaţionale 
ce permit observarea și măsurarea realității poate impune o altă structură 
intermediară, numită componentă. Practic, vorbim despre o structură conceptuală la 
nivelul unei dimensiuni, realizând același demers din etapa anterioară la acest 
nivel. Aceasta poate însă să lipsească şi să se ajungă direct la variabile la nivelul 
unei anumite dimensiuni. Totul depinde de complexitatea temei și de posibilităţile 
de rafinare pe care le permite tema de cercetare. Componentele joacă același rol cu 
dimensiunile pentru conceptul de bază. Ideea este să se realizeze o detaliere 
suficientă a problemei analizate, atât în vederea unei mai bune înţelegeri, cât și a 
măsurării realității, a culegerii datelor. 

Caracteristicile fenomenului se identifică la nivelul fiecărei componente sau 
dimensiuni. Aceste caracteristici reprezintă elemente observabile sau măsurabile 
ale unei anumite dimensiuni. Vorbim despre variabile sociale sau economice care 
permit observarea realității supuse cercetării. Operaţionalizarea presupune un 
proces care conduce la ideea de a determina o listă sau un număr cât mai mare de 
caracteristici posibile, din care să fie alese ulterior cele mai semnificative în raport 
cu obiectivul principal al cercetării, precum şi cu posibilitățile efective de culegere 
a datelor. În literatura de specialitate, aceste caracteristici sau atribute observabile 
sunt numite indicatori. 

În următoarea etapă, se definesc elementele concrete care sunt elaborate în 
contextul construirii instrumentului de colectare a datelor. Mai precis, ifemii şi 
întrebările ce apar într-un chestionar statistic sunt construiți pe baza 
caracteristicilor stabilite pentru fiecare dimensiune. 

În final, după stabilirea instrumentului de culegere a datelor, se definesc 
variabilele şi indicatorii statistici utilizaţi în etapa de analiză a datelor. Variabilele 
statistice sunt instrumentele finale pe baza cărora se concretizează informaţiile sau 
cunoștințele vizate în cercetarea ştiinţifică pe bază de sondaj. După tipul lor, 
acestea sunt numerice și nenumerice. Indicatorii statistici se referă la rezultate ale 
măsurării statistice şi sunt purtători de informaţie, adică elemente de bază ale 
obiectivării statistice prin care se descrie şi se explică realitatea studiată. Pentru 
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fiecare variabilă sau cuplu de variabile se delimitează indicatorii statistici care vor 
fi calculaţi pe baza datelor culese. Fiecare asemenea indicator este însoţit de 
metodologia necesară calculului şi interpretării proprii. 

În această lucrare preferăm o schemă a operaționalizării care este mai 
aproape de cercetarea cantitativă de tip statistic. Pentru un concept considerăm 
două posibile niveluri de descompunere ce rezultă din activitatea de analiză: 
dimensiunile şi componentele. Urmează etapa operaţională de identificare a 
caracteristicilor, ceea ce presupune definirea unor variabile reale concrete pentru 
fiecare dimensiune. În final, se construiesc instrumentele de culegere și analiză a 
datelor. Schematic, etapa de operaţionalizare se poate prezenta în tabelul de mai 
jos. Ca exerciţiu, pentru un concept de bază considerăm trei dimensiuni. Pentru 
prima şi a treia dimensiune propunem câte două componente, iar pentru 
dimensiunea a doua, doar variabile. 


Tabelul 1.1. Schema operaționalizării conceptelor 





























Concept 
Dimensiunea | Dimensiunea 2 Dimensiunea 3 
Componenta 1l | Componenta 12 - Componenta 31 | Componenta 32 
Variabila 11] Variabila 121 Variabila 21 Variabila 311 Variabila 321 
Variabila 112 Variabila 122 Variabila 22 Variabila 322 
Variabila 123 Variabila 323 
Variabila 124 
ltem |ll] ltem 1211 ltem 21| ltem 311] Item 3211 
Item 1112 ltem 1221 ltem 212 Item 3221 
Variabile Variabile Variabile Variabile Variabile 
statistice statistice statistice statistice statistice 
Indicatori Indicatori Indicatori Indicatori Indicatori 7 
statistici statistici statistici statistici statistici 
Exemplu 


Operaţionalizarea conceptului de opinie publică pentru ancheta propusă ca 
exemplu se poate realiza în mai multe moduri. Simplificând lucrurile, prezentăm 
mai jos o asemenea posibilă schemă de operaţionalizare. 

Concept: opinia cetățenilor oraşului A cu privire la activitatea primarului și 
posibilitatea realegerii acestuia. 

Dimensiuni: realizările din mandatul curent; caracteristici personale ale 
primarului; proiectul de viitor. 
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Componente 

— pentru dimensiunea realizări în mandatul curent putem structura câteva 
componente care să identifice tipurile de realizări ale primarului pe domenii: 
administrativ, economic, social, politic etc.; 

- pentru dimensiunea caracteristici personale se pot construi câteva 
componente: competenţe manageriale, competențe de comunicare, calitatea 
morală etc.; 

— pentru dimensiunea proiectul de viitor se pot identifica cel puţin două 
componente: opinia cetăţenilor cu ce ar trebui realizat în oraș; opţiunea de 
vot pentru viitorul primar. 

Caracteristici 

De exemplu, pentru ultima dimensiune, componenta opțiune de vor, se pot 
construi variabile de genul: aprecierea primarului actual; aprecierea contra- 
candidaţilor; vot pentru primarul actual; vot pentru un alt candidat etc. 

Itemi și întrebări 

Un exemplu de item în chestionar pentru caracteristica aprecierea 
primarului actual este prezentat mai Jos. 

Apreciaţi în ce măsură sunteți de acord cu afirmaţia: rezultatele activității 
primarului localităţii în mandatul care tocmai se încheie sunt în conformitate cu 
promisiunile electorale. 








[a 5 
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Variabile statistice 

Pornind de la întrebarea prezentată mai sus, se poate defini variabila 
alternativă nominală care măsoară răspunsul persoanelor cu privire la prima 
opțiune de răspuns. Cele două valori posibile sunt Da şi Nu și pot fi codificate cu 
valorile 7 şi 0. 

Indicatori statistici 

Continuând exemplul de mai sus, se poate stabili un indicator precum media 
variabilei alternative, adică proporţia respondenţilor care au bifat prima opțiune de 
răspuns. 


Definirea obiectivelor 
Scopul principal al cercetării prin sondaj este producerea unei cunoaşteri 
ştiinţifice cu aplicaţii practice şi teoretice directe. Acesta este atins prin câteva 
categorii de obiective specifice cunoașterii statistice: 
— descrierea statistică a problemei la nivelul eşantionului extras; 
— explorarea şi clarificarea anumitor dimensiuni ale problemei de cercetat; 
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— estimarea parametrilor distribuţiei populaţiei totale după variabile de interes 
sau descrierea fenomenului la nivelul ansamblului; 

— estimarea parametrilor modelelor care exprimă legătura dintre diferite 
variabile sau explicarea cauzelor fenomenului; 

— prognoza unor evenimente viitoare; 

— testarea ipotezelor statistice (se pot testa ipoteze: fie cu privire la parametri 
sau cu privire la legea de distribuţie a populaţiei totale după anumite 
variabile, caz în care se face apel la teoria testelor statistice parametrice; fie 
cu privire la structura populaţiei sau la influenţa anumitor factori, caz în care 
se face apel la testele statistice neparametrice). 

Toate aceste obiective sunt operaţionale cu ajutorul variabilelor statistice şi 
al indicatorilor aferenți prezentaţi în etapa de operaţionalizare. Practic, fiecare 
indicator reprezintă instrumentul care permite obţinerea unui rezultat sau a unei 
informaţii, adică permite specificarea unui obiectiv concret al cercetării. 

Formularea obiectivelor cercetării în această variantă operaţională şi foarte 
precisă presupune și un exerciţiu de evaluare și, eventual, de reformulare a unor 
obiective formulate în faza de debut a cercetării sau într-un document iniţial 
elaborat de un beneficiar al cercetării. 


Exemplu 

Conform schemei de operaţionalizare a conceptului de opinie, așa cum a fost 
prezentată anterior, pentru dimensiunea proiect de viitor s-au identificat compo- 
nenta opțiunea de vot, caracteristica vor pentru primarul actual şi indicatorul sta- 
tistic proporția cetățenilor care votează cu actualul primar. În acest caz, se poate 
defini un obiectiv precis al cercetării, anume acela de a estima procentul persoa- 
nelor din oraș care ar vota din nou primarul actual la următoarele alegeri. 


Elaborarea ipotezelor 

În cadrul unei cercetări ştiinţifice, o ipoteză este o presupunere sau un enunţ 
cu privire la tema studiată și care trebuie testată sau verificată cu ajutorul datelor 
culese conform metodologiei cercetării. De regulă, în enunţul unei ipoteze se 
specifică o relaţie între doi termeni bine delimitaţi, care apar fie ca realităţi 
concrete (fenomene, procese etc.), fie în concepte. În cele din urmă, prin etapa de 
operaţionalizare, o ipoteză apare ca o relaţie între două sau mai multe caracteristici 
reale sau între variabilele statistice. 

Ipotezele sunt formulate ca anticipări ale unor rezultate şi de aceea iau forma 
unor enunţuri care conţin elemente precise, adică instrumentele identificate în etapa 
de operaţionalizare. Astfel formulate, ipotezele pot fi testate în etapa de analiză 
statistică a datelor culese. 
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În orice cercetare prin sondaj se formulează un set de ipoteze care dau 
scheletul cercetării sau direcția etapei de analiză a datelor. Ca anticipări de 
rezultate, ipotezele se definesc în strânsă legătură cu obiectivele cercetării şi cu 
structura conceptuală dezvoltată în etapa de operaţionalizare. Astfel, ipotezele apar 
ca relaţii între dimensiunile şi componentele conceptelor utilizate în anchetă, iar 
prin testarea acestora se obţine acel tip de cunoaștere complexă specifică cercetării 
științifice. 

Exemplu 

O ipoteză uşor de construit pentru exemplul sondajului de opinie presupune 
o relaţie între realizările primarului actual și opțiunea de vot pentru viitorul primar: 
Cetăţenii satisfăcuți de ceea ce a realizat primarul orașului vor vota cu acesta la 
viitoarele alegeri. O altă ipoteză ar putea fi formulată astfel: Existenţa unor 
suspiciuni privind calitatea morală a primarului este strâns legată de opțiunea 
pentru un contracandidat. În acest enunţ se poate observa că se stabilește o relaţie 
între doi termeni precizaţi în etapa de operaţionalizare: calitatea morală și opțiunea 
de vot pentru un nou mandat. 


Concluzie 

Modelul de analiză din cadrul unei cercetări ştiinţifice este reprezentat de un 
rezultat complex care aşează împreună obiectivele cercetării rezultate în urma 
etapei de operaţionalizare și setul de ipoteze de lucru ce stabilește relații între 
dimensiuni şi componente ale conceptului studiat. 

În tabelul 1.2 se prezintă un exemplu ipotetic de model de analiză ce apare 
sub forma unei scheme care identifică rezultatele etapei de operaționalizare și 
posibile relaţii dintre acestea, adică ipoteze ale cercetării. De asemenea, într-un 
asemenea tablou de sinteză se pot prezenta punctual și obiectivele cercetării 
identificate pentru fiecare dimensiune, respectiv pentru componentele adiacente. 


Tabelul 1.2. Model de analiză al cercetării 





Concept 











Dimensiunea | Dimensiunea 2 Dimensiunea 3 
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Ha 


Obiective 





Obiective Obiective Obiective Obiective 














căii 





Fundamentele cercetării prin sondaj 39 





Validarea instrumentelor 

Aşa cum sugerează Mouton şi Marais (1990), după etapa de operaţionalizare 
se impune un exerciţiu de evaluare a instrumentelor construite, pentru a răspunde la 
întrebarea dacă acestea sunt valide din punct de vedere ştiinţific. Cu alte cuvinte, 
acest efort presupune să evaluăm dacă instrumentele construite în această etapă 
corespund intenţiei de cercetare, adică într-adevăr măsoară ceea ce ne-am propus. 
Variabilele identificate în etapa de operaţionalizare reprezintă instrumente de bază 
care sunt transpuse în instrumentele de culegere a datelor (întrebări şi itemi în 
chestionarele statistice). Dacă aceste instrumente nu respectă anumite condiţii de 
calitate, atunci etapele de culegere și analiză a datelor sunt viciate, iar rezultatele 
anchetei sunt afectate de erori. 

Etapa de măsurare statistică presupune utilizarea unor instrumente de 
calitate. Fiabilitatea măsurării statistice (reliability) se referă la această proprietate 
de a asigura rezultate consistente prin repetarea procesului de observare. 
Validitatea procesului de măsurare se referă la gradul în care un instrument 
reuşeşte să măsoare ceea ce a fost conceput să observe (cuantifice). Există mai 
multe metode de evaluare a calităţii instrumentelor și procesului de observare 
statistică. De exemplu, pentru un chestionar se utilizează analiza consistenţei 
interne (coeficientul Conbach sau coeficientul „alphă”, diverse teste de evaluare). 

Validitatea reflectă acele erori de măsurare care apar sistematic în procesul 
de măsurare. În literatură se prezintă mai multe metode de evaluare a acestei 
proprietăţi (Cozby, 2011; Mouton şi Marais, 1990): expert validity (se realizează 
direct de cei interesaţi de rezultate); content validity (se verifică dacă elementele 
incluse în instrumentul de măsurare reprezintă în mod adecvat realitatea supusă 
observării); criferion validity (se utilizează un criteriu extern de validare a unei 
măsuri); construct validity (se verifică dacă o anumită măsură este consistentă cu 
conceptul teoretic supus evaluării). 


1.3.2. Elaborarea chestionarului statistic 


Problematica elaborării chestionarului statistic este una complexă şi necesită 
mai mult spaţiu decât un capitol într-o lucrare dedicată sondajului. Ca o sinteză, şi, 
în același timp, ca un punct de plecare, pentru cei interesați să construiască un 
chestionar cu scopul de a fi aplicat într-o cercetare prin sondaj, prezentăm câteva 
elemente structurate pe trei niveluri de analiză: semantic (sens), sintactic (structură) 
şi pragmatic (funcţie). De asemenea, pentru abordarea propusă în acest capitol, 
utilizăm următoarea definiţie de lucru: prin chestionar înțelegem o succesiune 
logică şi psihologică de întrebări, imagini şi simboluri grafice puse într-o formă 
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arhitecturală, care are funcţia de a determina un comportament asupra subiectului 
uman în legătură cu obținerea de informaţii pe o anumită temă. 

Definiţia prezentată mai sus sugerează cele trei dimensiuni fundamentale ale 
unui chestionar, în acord cu cele trei niveluri de analiză propuse (Jemna, 2004): 

— conţinutul (întrebări, imagini şi simboluri grafice - nivelul semantic); 

_ forma sau maniera de aranjare a elementelor chestionarului într-un întreg 
coerent (nivelul sintactic). Nu orice succesiune de întrebări este un chestionar; 

— funcţia (culegerea datelor în condiții de calitate aşteptate - nivelul 
pragmatic). 

În structura acestui subcapitol, potrivit metodei de analiză asumate, ne oprim 
la următoarele aspecte: analiza tipurilor de întrebări care compun un chestionar; 
arhitectura şi metodele de elaborare a chestionarului; tipuri de chestionare și 
elemente specifice care pot înlesni realizarea funcției sale. 


a. Construirea întrebărilor 
Întrebările care apar în chestionar se pot clasifica după două criterii: 

— în funcţie de posibilitatea de înregistrare a răspunsurilor, există întrebări: 
deschise, semi-deschise, închise; 

— în funcţie de conţinutul lor, se identifică întrebări: de date factuale (ce face), 
de opinie (ce gândeşte), de intenţie (ce va face), de motivaţie (cum 
apreciază), care reclamă cunoştinţe (ce ştie), de identificare (cine este) etc. 

În cazul întrebărilor închise, posibilităţile de răspuns sunt date sub forma 
unei liste complete, închise, persoana anchetată fiind constrânsă să aleagă unul sau 
mai multe din răspunsurile prezentate în chestionar. 


Exemplu 
Cum apreciaţi, în general, activitatea primarului localităţii A în ultimii 4 ani? 





[ Foarte bună | 
| Bună 
Suficient de bună 











Satisfăcătoare 





Insuficientă | | 





În anchete se preferă întrebările închise pentru că sunt uşor de elaborat, de 
codificat şi, ulterior, facil de prelucrat. Problemele cele mai importante pe care le 
ridică întrebările închise sunt exhaustivitatea şi exclusivitatea listei răspunsurilor 
propuse (Lejeune, 1994, p. 66). 

Într-o oarecare măsură, exhaustivitatea şi exclusivitatea sunt antinomice, 
căci, în tendinţa de a acoperi toate posibilităţile de răspuns, apar şi suprapuneri de 
sens. Este foarte greu de propus posibilităţi de răspunsuri mutual exclusive, 
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deoarece orice formulare, ca o construcţie semantică şi sintactică, este susceptibilă 
la interpretări în câmpul semantic al cuvintelor folosite. Dacă exhaustivitatea cere 
acoperirea tuturor posibilităţilor de răspunsuri, exclusivitatea cere o acoperire 
semantică între acestea. Din raţiuni de eficienţă, deseori se renunță la 
exhaustivitate, după cerinţele anchetei, însă o listă exclusivă a răspunsurilor 
posibile este necesară pentru a înlătura atât redundanţele, cât şi neînțelegerile. 


Exemplu 
Care considerați că este cea mai importantă trăsătură personală a primarului 
localității A? 





Modest 

Inteligent 

Bun orator 

Sociabil | 

Atent | 
| 
| 

















Responsabil 
Parolist 














În exemplul de mai sus, lista răspunsurilor posibile este una foarte mare, 
astfel că exhaustivitatea nu poate fi atinsă. Lista poate fi mărită, în funcţie de 
interes, cu încă un număr de opțiuni, cu atenţie asupra condiţiei de exclusivitate. 

În cazul întrebărilor deschise, există posibilitatea oricărui răspuns şi nu se 
impune nici o constrângere. Aceste întrebări sunt folosite în cazurile în care se 
doreşte să se obţină date sau informaţii mai sensibile sau în cazurile când 
elaborarea unei liste de răspunsuri nu este posibilă practic. 


Exemplu 
Care este motivul principal pentru care nu l-aţi mai vota pe actualul primar la 
viitoarele alegeri? 


De regulă, întrebările deschise cer răspunsuri spontane, care redau cel mai 
bine latura subiectivă și elementele de context. În acest sens, în constituirea 
întrebărilor deschise, un rol important îl ocupă stimulii. Prin stimuli se poate realiza 
mai uşor testarea unor comportamente şi obţinerea unor informaţii legate de 
atitudini, motivații, nevoi. Întrebarea deschisă este o structură cu caracter stimu- 
lativ, o structură „deschisă” cu implicaţie biunivocă: atât din partea expeditorului 
(cel ce concepe întrebarea), cât şi a destinatarului (cel căruia îi este adresată 
întrebarea). Astfel, formularea întrebării suportă exigența susceptibilităţii la 
interpretări, respondentul fiind plasat în faţa propriei limite de a formula şi a 
exprima un mesaj. În consecință, o anumită manieră de a folosi cuvintele 
corespunde unui anume mod de a gândi în societate. lar aceste modele de 
comunicare, susținute de ideologii, sunt mereu supuse transformărilor. Cazul 
României de după 1990 este semnificativ în acest sens. Foarte multe cuvinte au 
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suferit schimbări majore în câmpul lor semantic, iar folosirea lor cere cunoaşterea 
acestui sens de evoluţie (de exemplu, evoluţia cuvintelor din sfera politicului sau a 
economicului). Prin necesitatea cunoaşterii câmpului semantic al cuvintelor, 
întrebările deschise ridică probleme atât în faza de elaborare, cât mai ales în faza de 
analiză şi prelucrare. Aceste întrebări, care nu pot fi codate şi analizate după 
metodele cantitative, se pretează la o analiză calitativă, metoda cel mai des întâlnită 
fiind analiza de conţinut. 

Întrebările semi-deschise au în lista răspunsurilor propuse şi o modalitate 
deschisă de răspuns. 


Exemplu 
Care dintre elementele specifice ale localităţii A a fost cel mai puţin folosit de 
actualul primar? 





| Resursa naturală | 
Capitalul uman 
Poziţia geografică 

| Altceva (ce anume?) 

















Aceste întrebări rezolvă într-o anumită manieră problema exhaustivităţii 
întrebărilor închise pentru că oferă posibilitatea includerii unor răspunsuri diferite 
de cele din lista propusă. De asemenea, întrebările semi-deschise rezolvă în parte şi 
problema codării din cazul întrebărilor deschise. În faza de desprindere a datelor 
din chestionar, variantele de răspuns deschise pot fi codate, completând lista 
răspunsurilor propuse. O problemă a listei răspunsurilor o menţionează Claude 
Javeau, care arată riscul influenţei persoanelor prin sugestii la varianta deschisă 
(Javeau, 1978, p. 72). Este vorba despre un stimul arhitectural (lista răspunsurilor) 
care determină un comportament analog în cadrul modalităţii deschise. Prin 
varianta deschisă este posibil să nu se aducă nici un fel de contribuţie la cunoaştere. 

Întrebările de date factuale sau de comportament sunt uşor de formulat şi de 
înţeles pentru cei intervievaţi. Răspunsul depinde de datele cerute, iar dacă se 
referă la comportamente sensibile, pot să apară erori prin efectul de dezirabilitate 
socială. Există o tendinţă a respondențţilor de a alege un răspuns care corespunde 
cel mai bine aşteptărilor celorlalți sau unui statut social apreciat. 


Exemplu 
Ce aţi făcut la ultima acţiune organizată de primar privind curăţenia localității? 





m-am alăturat celor care au cules deşeurile din parc 





am fost la plantat copaci 
mi-am văzut de treburile mele 
am fost doar să văd ce se întâmplă 























Fundamentele cercetării prin sondaj 43 





Întrebările de opinie pot ridica probleme atunci când persoana nu are o opinie 
clară sau nu are o opinie. În întrebările de opinie poate să apară problema falsei 
sinonimii a cuvintelor. Menţionăm riscul de a se confunda opinia cu motivaţia. 
Pentru a stimula gândirea şi formularea opiniei, se poate apela la formulări indirecte. 


Exemplu 


Care dintre domeniile de activitate consideraţi că au înregistrat o dezvoltare 
datorită implicării directe a primarului? Alegeţi în ordine două variante. 





| Cultura | 
Sănătatea | 
| 








Educaţia 





| Serviciile 
| Asistenţa socială 
| 








Economia 








Întrebările de motivaţie. În comparaţie cu opinia (rezultatul unei analize 
critice, a unei evaluări axiologice), motivaţia reflectă implicaţiile subiective ale 
persoanei în justificarea unei acțiuni, alegeri sau idei. În cercetarea motivaţiei, pro- 
blema cea mai delicată o constituie riscul sugerării unui răspuns. Dacă se produce 
acest risc, răspunsul persoanei nu oferă motivaţia reală, ci pe cea conştientizată în 
momentul anchetei. 


Exemplu 

La ultimele alegeri, în oferta electorală a primarului a existat și promisiunea 
egalizării şanselor între femei și bărbaţi. În ce măsură a cântărit acest lucru în decizia 
dvs. de vot? 













7 
În foarte mare 
măsură 


| | | 


Întrebările de intenție folosesc la studiul proiecţiilor, previziunilor 
personale. Răspunsurile la aceste întrebări pot fi distorsionate prin efectul dezira- 
bilităţii sociale. O posibilitate de limitare a acestei erori ar fi formularea întrebării 
în variantă deschisă. 









In foarte mică 
măsură 





Exemplu 
Ținând cont de spectrul politic actual, cu ce partid aţi vota la alegerile viitoare? 














UDMR 
Altul (care?) 





| 
| 
|_PMP 
| 
| 
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Întrebările care reclamă cunoştinţe dau cea mai înaltă rată de non- 
răspunsuri. De obicei, sunt întrebări sensibile, însă pot juca un rol foarte important 
ca întrebări de control al consistenţei şi al consecvenţei răspunsurilor. 


Exemplu 
Care sunt cele trei obiective strategice pentru localitatea A anunțate de actualul 
primar în campania electorală? 


Întrebările de identificare conţin, în general, date sensibile. Pentru a nu avea 
un efect de context, de obicei, sunt plasate la sfârşitul chestionarului. Aceste 
întrebări pot introduce erori sistematice (de exemplu, de rotunjire a vârstei). Pentru 
reducerea erorilor la întrebările care privesc vârsta, nivelul venitului sau alte date 
cifrice se recomandă utilizarea intervalelor de variaţie. 


Exemplu 
Starea civilă: 











celibatar 
căsătorit 
divorțat 








b. Arhitectura chestionarului 

Subiectul arhitecturii unui chestionar aduce în discuţie cel puţin două 
probleme: tipurile de întrebări care joacă un rol sintactic în construcția 
chestionarului; modalităţile de elaborare a unui chestionar. 


Tipuri de întrebări în structura chestionarului 

Septimiu Chelcea ne oferă o tipologie a întrebărilor din structura 
chestionarului care cuprinde: întrebări introductive, de trecere, filtru, de control şi 
de identificare (Chelcea, 1975, p. 187). 

Întrebările introductive au rolul de interfaţă între persoana anchetată şi 
chestionar. Menţionăm că această funcţie o îndeplinesc cu mare succes semnele 
iconice. Prima pagină a chestionarului cuprinde, de obicei, sigla și numele 
instituţiei care realizează ancheta. Aceasta captează atenţia şi oferă un prim impact 
cu destinatarul. Urmează o frază sau o imagine sugestivă care pune în temă 
interlocutorul cu privire la subiectul anchetei. Se pot aduce, în funcţie de context, 
informaţii suplimentare cu privire la motivul anchetei, la confidenţialitatea datelor 
ete. Toate acestea au rolul de a îndepărta sau canaliza diversele conotaţii care pot 
apărea la nivelul destinatarului cu privire la funcţia chestionarului. Se recomandă 
ca întrebările de introducere să fie închise; să nu fie întrebări sensibile sau la care 
este greu de răspuns. De exemplu, în introducere se pot folosi unele întrebări care 
au un interes general şi care vizează subiecte şi preocupări actuale. Prin aceste 
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întrebări se actualizează în mintea destinatarului măcar o parte a contextului temei 
cercetate. Există însă şi chestionare care, după o punere sumară în temă cu privire 
la anchetă, încep direct cu întrebări de identificare. 

Întrebările de trecere delimitează structura chestionarului şi realizează 
legătura între diferite părţi ale acestuia, pregătind interlocutorul pentru ceea ce 
urmează. Putem vorbi aici despre coeziunea internă a chestionarului, care trebuie 
să fie puternică şi să dea o structură logică şi psihologică a conţinutului, pe linia 
realizării funcţiei chestionarului. Pentru obţinerea acestei coeziuni se folosesc 
elemente de trecere, de legătură, de relaţie. Acestea au rolul de a reduce proiecţiile 
efectelor stimulilor de la o secțiune la alta. Un exemplu de trecere, destul de 
evident în chestionar, este acela de la întrebările referitoare la tema anchetei la 
întrebările de identificare. Aceste întrebări pot fi prefaţate de câteva informaţii şi 
explicaţii care să reducă starea de susceptibilitate a destinatarului (de exemplu, o 
explicaţie a operatorului, în cazul chestionarului administrat, sau o frază, o imagine 
sau o figură, în cazul chestionarului autoadministrat). 

Întrebările filtru supun unor condiţii necesitatea de a răspunde la o întrebare 
sau la un set de întrebări următoare. Aceste întrebări sunt deosebit de importante în 
cazul întrebărilor de date factuale. Prin întrebările filtru se evită răspunsuri care nu 
au acoperire în fapte. 

Întrebările de control apar în structura chestionarului cu rolul de a verifica 
consecvenţa şi consistenţa răspunsurilor de-a lungul chestionarului. Întrebările de 
control apar în contexte diferite de subiectul lor. Prin întrebările de control se poate 
genera şi un comportament asupra persoanei anchetate, având un caracter 
stimulativ. Odată întâlnită o astfel de întrebare, persoana anchetată poate 
conştientiza faptul că nu trebuie să răspundă oricum. 

Întrebările de identificare cer date şi informaţii cu privire la persoana celui 
anchetat. Ele se referă, cel mai adesea, la identificarea persoanei după sex, vârstă, 
nivel de pregătire, venit, stare civilă etc. Despre locul acestor întrebări în cadrul 
chestionarului, părerile sunt împărțite. Unii specialişti consideră că este bine ca ele 
să apară la sfârşit, pentru a nu avea un impact nefavorabil asupra persoanei 
chestionate, cunoscut fiind faptul că uneori se evită răspunsul la astfel de întrebări. 
Alţi specialişti consideră că întrebările de identificare trebuie doar să apară grupate, 
fie la începutul chestionarului, fie la sfârşitul lui, pentru a nu crea un efect de 
context și a nu influenţa răspunsurile (Javeau, 1978, p. 78). 


Tehnici de elaborare a chestionarului 

În arhitectura chestionarului, pe linia mesajului, se poate vorbi despre o 
curbă de tensiune care exprimă intensitatea relaţiei dintre emiţător şi receptor de-a 
lungul chestionarului. Pentru a face posibilă funcţia chestionarului, structura sa 
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trebuie să aibă caracter stimulativ în această direcție. În consecinţă, începutul 
chestionarului trebuie să capteze atenţia. Primele elemente din chestionar sunt 
construite pentru a suscita un interes mare pentru destinatar, chiar dacă la nivelul 
expeditorului mesajul are interes scăzut. Pe măsură ce se parcurge chestionarul, 
raportul se inversează. Interesul destinatarului începe să scadă, iar cel al 
expeditorului atinge valoarea maximă spre finalul chestionarului. Între cele două 
extreme, se poate vorbi despre o relaţie strânsă, generată de un interes comun Şi un 
raport de tensiune proporţional. Pentru a realiza această curbă de tensiune, în 
funcţie de tema anchetei şi de populaţia de referinţă, se pot utiliza următoarele 
tehnici de construire a chestionarului (Chelcea, 2004, p. 131): tehnica pâlniei, 
tehnica pâlniei răsturnate, tehnica ce ţine cont de efectul „halo” . 

Tehnica pâlniei 

Are la bază principiul deducţiei, adică trecerea de la general la particular. 
Chestionarul se deschide cu întrebări de ordin general, care sunt, de obicei, 
deschise şi îi lasă interlocutorului posibilitatea exprimării subiective cu privire la 
tema propusă. Această arhitectură are caracter stimulativ şi are scopul de a reduce 
influenţa anumitor tipare, coduri, mentalități etc. Cu fiecare întrebare se 
construieşte un cadru care canalizează atenţia spre problemele specifice, particulare 
ale temei, probleme de mare importanţă pentru anchetă. Tehnica pâlniei dă 
rezultate în cadrul populațiilor cu un nivel de pregătire mai ridicat (la persoane care 
pot să răspundă la întrebările de ordin mai general, fără a avea un comportament de 
respingere) şi în cazul unor teme delicate, care necesită o pregătire a persoanei 
anchetate. Pentru populaţiile cu un nivel de pregătire mai scăzut se recomandă 
tehnica bazată pe principiul opus. 

Tehnica pâlniei răsturnate 

Are la bază principiul inducției, adică drumul de la particular la general. 
Chestionarul debutează cu întrebări închise, de date factuale sau de opinie, la care 
se poate răspunde uşor. Prin această tehnică, stimulul arhitectural are rolul de a 
facilita persoanei procesul de înţelegere şi de comunicare la nivel sintetic, general. 

Tehnica ce ține cont de efectul „halo” 

Prin această tehnică se are în vedere comportamentul sentimental sau logic al 
persoanei la impactul cu anumite întrebări sensibile ale chestionarului. Impactul 
poate determina o influențare sau o contaminare a răspunsurilor ulterioare (efect 
„halo”). Corelaţiile pe care le face persoana anchetată între subiectul întrebării (sau 
tema anchetei) şi fondul său cultural sau sentimental generează conotaţii 
emoţionale sau ideologice. De exemplu, în cazul anchetelor cu caracter politic, 
religios, sentimental sau cu alte asemenea teme sensibile, efectul „halo” poate avea 
efecte semnificative. Evitarea acestor efecte se poate realiza prin aşezarea 
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întrebărilor sensibile fie la finalul chestionarului, fie într-un cadru în care sunt 
pregătite prin întrebări de trecere, semne iconice şi informaţii explicative. 


c. Calitatea chestionarului. Probleme specifice 

Funcţia chestionarului presupune culegerea de date de la populaţia anchetată 
în condiţii de calitate ce presupun erori cât mai mici, timp de completare cât mai 
scurt, costuri reduse. În funcţie de tema de cercetare, de populaţia de referință şi de 
metoda de sondaj aleasă, se poate defini o tipologie a chestionarelor statistice. 
Pentru fiecare caz în parte, atingerea funcţiei chestionarului presupune o serie de 
condiţii de calitate particulare. Pe lângă tipul de chestionar ales, este important să 
se analizeze o serie de probleme specifice procesului de elaborare, astfel încât 
produsul finit să faciliteze cel mai bine culegerea datelor. Ne referim aici la 
lungimea chestionarului, editare, testare etc. 


Tipuri de chestionare 

Tipologia chestionarului ne oferă un instrument metodologic cu ajutorul 
căruia putem evidenția domeniile de utilizare a chestionarului, elementele 
chestionarului ne este oferită de Septimiu Chelcea, care propune următoarele 
criterii de clasificare: conţinutul informaţiilor, forma întrebărilor, modul de aplicare 
a chestionarului (Chelcea, 1975, p. 143). 

După conţinutul informaţiilor, există două tipuri de chestionare: chestionare 
de date factuale şi chestionare de opinie. 

Chestionarele de date factuale sunt chestionare de tip oficial şi au un scop 
administrativ. Aceste chestionare sunt de cele mai multe ori tipizate şi folosesc la 
culegerea unor date periodice. Datele culese cu aceste chestionare au un caracter 
obiectiv şi se referă la fapte. 

Chestionarele de opinie se adresează opiniilor şi atitudinilor personale, iar 
informaţiile culese cu ajutorul lor au îndeosebi un caracter subiectiv. Pe lângă 
opinii, motivații, atitudini, comportamente, prin acest tip de chestionare se obţin și 
date de identificare a persoanei, date care au un caracter obiectiv. În general, 
chestionarele de opinie actuale sunt construite cu întrebări care privesc ambele 
tipuri de date, atât fapte, cât şi atitudini, opinii, iar întrebările de identificare sunt 
prezente în chestionar pentru a corela datele şi informaţiile obţinute cu profilul 
personalității celui care răspunde. 

După forma întrebărilor, pot fi: chestionare cu întrebări închise, chestionare 
cu întrebări deschise şi chestionare cu întrebări mixte. 

Chestionarele cu întrebări închise sunt chestionarele în care răspunsurile la 
întrebări sunt fixate dinainte, iar persoana care va răspunde trebuie să aleagă un 
răspuns din cele propuse. Întrebările închise dau posibilitatea codării în momentul 
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elaborării, iar chestionarul cu astfel de întrebări se mai numește şi chestionar 
precodat. Precodarea presupune atribuirea unui cod numeric sau alfabetic fiecărui 
răspuns propus şi dă posibilitatea unei prelucrări ulterioare mult mai facile. 

Chestionarele cu întrebări deschise conţin întrebări care nu oferă variante de 
răspuns; răspunsurile sunt lăsate la latitudinea celui chestionat. 

Chestionarele cu întrebări mixte au în componenţa lor atât întrebări închise, 
cât şi întrebări deschise. Acestea sunt chestionarele cel mai des folosite. 

După modul de aplicare a chestionarului, se practică două tipuri: chestionare 
autoadministrate şi chestionare administrate de un anumit personal (operatori). 

Chestionarele autoadministrate sunt numite aşa pentru că răspunsurile la 
întrebări sunt date direct de persoana interogată, fără nici o mediere din partea 
anchetatorului. Cele mai folosite tipuri de chestionare autoadministrate sunt cele 
trimise prin poştă, cele publicate în ziare, reviste şi pe internet, cele care însoțesc 
diferite produse sau care se găsesc în magazine. 

Chestionarele administrate sunt completate de un personal specializat, prin 
dialog direct cu persoanele anchetate. 


Lungimea chestionarului 

Problemele legate de lungimea chestionarului se referă la câteva aspecte. În 
primul rând, se are în vedere nevoia de informaţie şi capacitatea de a sintetiza 
această nevoie într-un număr restrâns de întrebări. În al doilea rând, există o 
constrângere de ordin economic, care se referă la costuri. Urmează aspectele legate 
de populaţia anchetată şi de condiţiile de administrare, care impun o limită de timp. 
De exemplu, ca durată de timp, o anchetă realizată pe stradă nu poate fi mai lungă 
de zece minute, iar una efectuată la domiciliu nu poate depăşi 30-40 de minute. 
Dacă chestionarul este lung şi complex, pot apărea erori datorate: fie oboselii, caz 
în care scade capacitatea de concentrare şi pot apărea răspunsuri eronate, fie lipsei 
de timp sau de disponibilitate, care duce ușor la non-răspunsuri. În unele cazuri, 
chiar dacă chestionarul este mai lung, dar nu peste o anumită limită, aceste reacţii 
comportamentale pot fi ameliorate. Orice relaţie cere un anumit interes. Dacă 
uneori este posibil să se stimuleze acest interes pe cale materială, mult mai 
important este ca chestionarul însuşi să suscite interes. O astfel de situaţie 
presupune ca forma şi conţinutul chestionarului să fie interactive, stimulative, 
tensionale. Elementele chestionarului trebuie să „curgă” într-o anumită coerenţă 
logică şi psihologică ce poate să întreţină relaţia până la capăt, fără ca lungimea 
chestionarului să fie un impediment. 

Editarea chestionarului 

Dacă forma şi structura chestionarului ne dau arhitectura sa conceptuală care 
face posibilă funcţia, editarea sau punerea în pagină constituie materializarea 
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acestei structuri şi reprezintă un element de interfaţă. Prin editare se adună toată 
munca „nevăzută” de elaborare a unui chestionar. Caracterul său este stimulativ, 
atât în cazul chestionarului administrat de operator, cât şi în cazul chestionarului 
autoadministrat. În ipoteza unui conţinut şi a unei structuri conceptuale de calitate, 
o materializare care nu este pe măsură poate diminua eficiența chestionarului. 
Designul chestionarului cere, în primul rând, vizibilitatea formei. Claritatea, 
densitatea şi aspectele de simetrie în delimitarea elementelor chestionarului, apoi 
culoarea şi estetica formelor, calitatea imprimării şi a hârtiei, toate sunt elemente 
importante care contribuie la reducerea erorilor de observare. Importanţa 
prezentării materiale a chestionarului devine mult mai evidentă în cazul 
chestionarului autoadministrat. Un chestionar de o bună calitate editorială impune 
seriozitate, profesionalism şi contribuie la câştigarea încrederii persoanei anchetate. 


Testarea chestionarului 
Înainte de aplicarea chestionarului, are loc testarea acestuia pe un eșantion 
mic, de maxim 50 de persoane, în condiţii cât mai apropiate de ancheta propriu- 
zisă. Interesul testării este să evidenţieze dacă chestionarul oferă informaţia dorită, 
precum şi dificultățile care apar în momentul culegerii datelor. Ameliorarea 
chestionarului se poate realiza prin modificările sugerate de testul efectuat. În faza 
de testare, administrarea chestionarului se poate transforma, ulterior, într-un scurt 
interviu. Se pot cere explicaţii despre răspunsurile oferite şi despre modul de 
înțelegere a întrebărilor, despre logica şi coerenţa întrebărilor în chestionar etc. În 
faza de testare a chestionarului, sunt importante răspunsurile la următoarele 
întrebări: 
— sunt înțelese corect întrebările? 
— se dau mai multe răspunsuri diferite la aceeaşi întrebare în condiţii similare? 
— care întrebări provoacă stimuli şi reacții diferite? 
— informaţiile cerute sunt la dispoziţia persoanelor anchetate sau este nevoie de 
un efort dificil de amintire? 
— vocabularul este adecvat persoanelor anchetate şi problemei studiate? 
— listele cu răspunsuri sunt exhaustive şi exclusive? 
— ordinea întrebărilor este logică? 
— există efect de context? 
— care întrebări sunt sensibile şi ce efect au? 
— etc. 
Informaţiile obţinute prin testare pot contribui la ameliorarea calităţii 
chestionarului prin câteva modificări de conţinut sau de formă: se pot modifica 
anumite întrebări, de exemplu, unele întrebări deschise pot fi transformate în 
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întrebări închise, se pot înlocui cuvintele ambigue sau abstracte, se pot reformula 
întrebările sensibile, se poate schimba ordinea anumitor întrebări etc. 


1.3.3. Elaborarea planului de sondaj 


Planul de sondaj vizează un ansamblu de instrumente și procedee care 
definesc principiul şi modalitatea de extragere a unei unităţi din populaţie pentru a 
intra în eşantion, structura şi condiţiile de calitate ale eșantionului. Elaborarea unui 
plan de sondaj presupune: 

— definirea populaţiei de respondenţi - stabilirea caracteristicilor de omo- 
genitate a populaţiei; | 

— identificarea informaţiilor suplimentare şi a surselor acestora; 

— definirea bazei de sondaj - o listă cu unităţile individuale ale populaţiei (când 
acest lucru este posibil); 

— alegerea unei metode de sondaj - aleatoare, empirice, mixte; 

— definirea eşantionului - volum, structură, metodă de extragere; 

— stabilirea gradului de precizie a rezultatelor. 


a. Definirea populaţiei de referință. Informații suplimentare 

Aşa cum am stabilit în secţiunea anterioară, în sondajele statistice ne 
interesează să stabilim o populaţie statistică ce vizează respondenţii sau cei care 
oferă informaţiile în procesul de culegere a datelor. Așadar, în prima etapă a 
planului de sondaj se definește această populaţie sau colectivitate de referință. În 
general, o populaţie statistică este definită prin precizarea a patru factori: natura, 
caracteristicile intrinseci, spaţiul şi timpul (Ardilly, 1994, p. 4). 

Natura populaţiei determină natura şi modul de organizare a unităţilor sale, 
care pot fi: simple (persoane) sau complexe (firme, familii, unităţi administrative 
etc.). În această etapă este important să se definească şi elementele de identificare 
ale unităţilor individuale din populaţie. Distincția dintre o unitate individuală de 
eșantionare şi cea de observare, realizată în secţiunile anterioare, este, de 
asemenea, foarte importantă. Această distincţie se referă la identificarea unităților 
individuale potrivit naturii populaţiei (unităţile de eșantionare se definesc după 
acest criteriu al modului de organizare a populaţiei) şi a posibilităţilor de culegere a 
datelor (unităţile de observare sunt cele care participă efectiv la culegerea datelor). 
În cele mai multe cazuri, cele două coincid, însă există şi situaţii când diferă (de 
exemplu, în anchetele legate de bugetele de familie, unitatea individuală este 
familia, dar cea de observare este o anumită persoană din familie, care trebuie bine 
desemnată). 

Caracteristicile intrinseci (de exemplu, înălţimea, cifra de afaceri etc.) joacă 
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a eşantionului. Spaţiul sau localizarea (de exemplu, municipiul Iaşi, judeţul Iaşi, 
regiunea de Nord-Est a României etc.) asigură delimitarea geografică a 
fenomenului. Data sau timpul (de exemplu, la 01.04.2018, în perioada 01.03 - 
01.04.2018) este un factor decisiv în definirea populaţiei. Dacă definirea populaţiei 
se face pe baza unor date şi informaţii dintr-o cercetare anterioară (de obicei, dintr- 
un recensământ), există posibilitatea apariţiei erorilor de neconcordanţă între 
populaţia reală şi cea definită prin planul de sondaj. 


b. Informații despre populaţie 

Informaţiile suplimentare care se pot obţine privesc în special structura 
populaţiei şi gradul de omogenitate a acesteia. Clasificarea populaţiei pe grupe cu 
omogenitate mai ridicată decât întregul reprezintă o soluţie importantă pentru 
creșterea gradului de precizie a rezultatelor. Această grupare presupune 
cunoașterea structurii populaţiei pentru una sau mai multe variabile puternic 
corelate cu tema de cercetare. Existenţa acestei informaţii este determinantă pentru 
alegerea unei metode de sondaj. Utilă este și informaţia privind gradul de 
omogenitate a populaţiei în raport cu o variabilă de interes sau cu o variabilă 
corelată cu tema de cercetare. Această informaţie este esenţială pentru calculul 
volumului eșantionului în cazul sondajelor aleatoare sau mixte. 


c. Construirea bazei de sondaj 

Baza de sondaj reprezintă o listă a unităților individuale ale populaţiei sau o 
bază de date care cuprinde elementele de identificare a unităților populaţiei după 
anumite caracteristici. O bază de sondaj trebuie să aibă câteva caracteristici 
principale: să permită identificarea clară, fără nici o problemă a unităţii individuale 
din populaţie, să fie completă sau exhaustivă, să nu fie redundantă, să ofere 
posibilitatea unei gestiuni facile (Ardilly, 1994, p. 24). 

Identificarea unităţilor individuale se face pe baza unor caracteristici numite 
de identificare. De exemplu, pentru o persoană, identificarea se face pe baza 
numelui şi a adresei domiciliului stabil, a unui cod (CNP sau cod de securitate 
socială etc.). Condiţia de exhaustivitate este importantă pentru selecţie. Dacă din 
baza de sondaj lipsesc unităţi care, în mod real, fac parte din populaţia de referinţă, 
se comite o eroare numită eroare de acoperire. În acest caz, se modifică şi 
probabilitățile de includere a unităților în eşantion. Redundanţa presupune ca baza 
de sondaj să nu aibă duble înregistrări, fapt care ar conduce la eroarea de a nu 
asigura aceeaşi şansă fiecărei unităţi de a intra în eşantion. Facilitatea gestiunii 
priveşte atât extragerea eşantionului, cât şi utilizarea unor informaţii suplimentare 
utile în faza de ameliorare a rezultatelor obţinute în sondaj. 

Baza de sondaj poate fi formată din unităţi individuale, cum ar fi persoanele, 
sau din unităţi complexe, cum ar fi: ariile geografice, unităţile administrativ- 
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teritoriale, clădirile, firmele etc. Avantajul bazelor de date compuse din unităţi 
complexe este, în primul rând, unul de stabilitate și poate asigura construcția unor 
planuri de sondaj care iau în considerare modul de organizare a populaţiei (de 
exemplu, sondajele pe serii sau sondajele în mai multe trepte). 

Pentru multe situaţii practice care necesită organizarea unui sondaj, este 
dificil sau chiar imposibil de construit o bază de sondaj. În asemenea cazuri, se 
realizează sondaje empirice, mixte, sondaje în mai multe trepte, sondaje de tip 
cluster. De exemplu, există baze de sondaj, cum ar fi cele de la evidenţa populaţiei, 
însă nu sunt accesibile şi nu pot fi utilizate ca sursă de informare. De asemenea, 
există baze de date ale unor instituţii precum Finanţele Publice, Camera de Comerţ 
şi Industrie, administraţiile publice locale, firmele de distribuţie a utilităţilor. În 
general, aceste baze sunt construite regional şi necesită o integrare (dar, şi în aceste 
cazuri, datele nu sunt accesibile pentru organizarea de sondaje). Mai pot exista 
baze de date construite de diverse instituţii, cum ar fi Institutul Naţional de 
Statistică, instituţiile private de sondaje sau instituţiile administrative (cele care 
construiesc listele electorale), însă problemele acestor baze sunt actualitatea lor 
(incluzând şi posibilitatea de actualizare a datelor) şi costul ridicat al informaţiei. 


d. Alegerea metodei de sondaj 

În lucrările de teoria şi practica sondajelor, în funcţie de principiul de 
selecţie a unei unităţi în eşantion, se delimitează două metode de sondaj: 
probabiliste sau aleatoare şi raţionate sau empirice. O combinaţie a celor două 
metode de bază conduce la o a treia categorie - sondajele mixte - care sunt cele mai 
utilizate în practică. 

Sondaje aleatoare 

Sondajele aleatoare permit calcularea a priori a probabilității fiecărei unităţi 
din populaţie de a aparține eşantionului. Acest lucru presupune existența unei baze 
de sondaj şi a unei scheme probabiliste de extragere. Prin această metodă se asigură 
baza de calcul a erorilor de eșantionare, a volumului eşantionului şi determinarea 
preciziei rezultatelor. În funcţie de şansa fiecărei unităţi de a intra în eşantion, se 
poate aplica fie sondajul aleator cu probabilităţi egale (sondaj aleator simplu), fie 
sondajul aleator cu probabilităţi inegale. Există situaţii când aceste sondaje se pot 
aplica practic ca atare, potrivit metodologiei specifice sondajului aleator, dar, 
frecvent, acest principiu de selecție este utilizat într-o anumită etapă a unui sondaj 
mai complex. 

Sondajele empirice 

Metodele de sondaj empirice se bazează pe o serie de criterii de selecţie care 
depind de natura populaţiei și de informaţiile disponibile. Principiul care justifică 
selecţia unităţilor are o bază empirică și vizează obţinerea unui eșantion pe baza 
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unei relaţii de corespondență cu întregul, potrivit unui criteriu bine stabilit (choix 
raisonn6). Aceste metode se folosesc atunci când este dificil (economic şi ştiinţific) 
de realizat un sondaj aleatoriu sau mixt. 

Obiectivul acestei metode este obţinerea de rezultate cât mai aproape de un 
sondaj aleator. Reprezentativitatea este asigurată printr-o corespondenţă între 
populaţia totală şi eşantion, fie la nivelul structurii, fie după alte criterii care 
asigură procesul de selecţie. 

Cel mai des întâlnite metode de sondaj empirice sunt: 

— metoda sondajului pe cote, care presupune obţinerea unui eşantion ca o 
miniatură a populaţiei după o structură dată de anumite variabile 
fundamentale pentru anchetă, numite variabile de control; 

— metoda unităţilor tip, care are ca principiu de bază împărţirea populaţiei în 
categorii omogene şi selectarea în eșantion a unităţilor care sunt cel mai 
aproape de media fiecărei categorii sau sub-populaţii; 

— metoda itinerariilor, o variantă a metodei cotelor, prin care operatorilor li se 
impune mult mai strict modalitatea de alegere a unităţilor care participă la 
anchetă, pe baza unui itinerar (un ansamblu de adrese, străzi sau zone din 
care se extrag persoane după anumite consemne clare). 

Sondajele mixte 

Combinarea metodei aleatoare cu cea empirică presupune obţinerea unei 
metode de sondaj mai eficiente. Criteriul de eficiență vizează atât precizia 
rezultatelor, cât şi dimensiunea economică şi de timp. Metodele mixte presupun 
combinarea unor principii sau instrumente oferite de cele două metode de bază în 
diferite forme şi în diferite etape ale procesului de eșantionare. Pentru 
exemplificare, facem trimitere la trei asemenea metode mixte: sondajul stratificat, 
în mai multe trepte, pe grupe (cluster). 

Sondajul stratificat admite, mai întâi, o componentă empirică ce presupune 
stratificarea populaţiei pe grupe omogene cu ajutorul unei variabile corelate 
semnificativ cu tema analizată. În pasul al doilea, din fiecare strat se extrag aleator 
sub-eșantioane de unităţi care vor constitui, în final, eşantionul anchetei. 

În cazul sondajului în mai multe trepte se aplică principiul stratificării de mai 
multe ori, la mai multe niveluri. De exemplu, într-o primă treaptă, se constituie o 
structură a populaţiei dintr-un număr de unități complexe primare asemenea 
straturilor. La acest nivel, are loc o extragere aleatoare a unui număr de unități 
primare. Ulterior, din fiecare unitate primară selectată urmează o altă selecţie 
aleatoare a câte unui sub-eşantion de unități complexe secundare sau individuale. 
Procesul se poate realiza în două sau mai multe etape. 
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Sondajele pe serii (cluster) presupun utilizarea unor structuri naturale ale 
unităților populaţiei numite serii sau clustere. În acest caz, selecția aleatoare 
presupune extragerea unui număr de serii din populaţie, iar eşantionul final se 
constituie din toate unităţile seriilor extrase. 


Criterii de alegere a unei metode de sondaj 

Opţiunea pentru una dintre cele două metode de sondaj, precum şi 
îmbunătăţirea eficienţei fiecărei metode, se realizează în funcţie de mai multe 
criterii”: informaţia disponibilă, precizia, costul, timpul, natura fenomenului, volu- 
mul eşantionului. 

Informaţia disponibilă 

Pentru populaţia de referință se pot obţine informaţii de diverse tipuri, prin 
intermediul mai multor surse: studii anterioare, documente, cercetări preliminare 
anchetei etc. Aceste informaţii sunt disponibile fie la nivel de unitate individuală, 
fie la nivelul întregii populaţii şi pot fi utilizate în faza de obţinere a eşantionului (a 
priori) sau după realizarea sondajului (a posteriori). Dacă la nivelul populaţiei 
totale se cunoaşte o informaţie dată printr-o variabilă puternic corelată cu variabila 
de interes, se poate realiza un plan de sondaj care respectă condiţiile de eficienţă: 
este mai precis, se realizează mai repede, necesită un eșantion de volum mai redus. 
Un exemplu este sondajul stratificat sau sondajul pe cote. De asemenea, o 
informaţie suplimentară se poate utiliza după ce a fost extras eşantionul, conform 
unui plan de sondaj, pentru a ameliora calitatea rezultatelor. Decizia de a utiliza 
informaţia suplimentară în construirea unui plan de sondaj sau în faza de 
ameliorare a rezultatelor se ia în funcţie de celelalte criterii utilizate în analiza 
calităţii unui sondaj. 

Precizia rezultatelor 

Pentru calitatea unui sondaj, precizia reprezintă criteriul fundamental. În 
practică, acest criteriu este frecvent pus în balanţă cu cel economic sau de timp, iar 
alteori se ia decizia de a realiza un tip de sondaj impus de natura fenomenului, fără 
a putea stabili o condiție de precizie. Totuşi, cel mai frecvent, se poate impune o 
limită a preciziei în funcţie de alte criterii, cum ar fi costul şi timpul de realizare ale 
sondajului. Pentru sondajele aleatoare şi mixte se poate determina gradul de 
precizie a rezultatelor, în timp ce pentru sondajele empirice se pot face doar 
aprecieri bazate pe expertiză. Sondajele mixte sunt mai precise decât cele aleatoare 
simple. 





2 Am prezentat asemenea criterii în lucrarea: D.V. Jemna, „Criterii de alegere a unei metode de 
sondaj în cercetarea statistică”, Analele Universităţii „ALI. Cuza” din laşi, Tomul LII/LIII, 2005- 
2006, pp. 373-379. 
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Costul 

Marea majoritate a sondajelor sunt realizate în condiţii de cost fixate a priori. 
Cu alte cuvinte, costul total al anchetei poate reprezenta o restricție importantă 
pentru a decide în privinţa unui tip de sondaj. Realizarea unui sondaj nu este doar o 
activitate ştiinţifică, ci şi o activitate economică. Dintre mai multe planuri de 
sondaj cu un grad de precizie apropiată, de obicei, se optează pentru un plan de 
sondaj mai economic, dacă eforturile sunt semnificativ mai reduse. Sondajele 
empirice sunt, de obicei, mai puţin costisitoare, în comparaţie cu cele aleatoare sau 
mixte. Sondajele aleatoare presupun, de regulă, un eșantion de volum mare şi 
existența unei baze de sondaj, condiţii ce conduc la creşterea costului anchetei. În 
condiţiile în care costul anchetei nu reprezintă o problemă, dacă situaţia o permite, 
este preferabil să se organizeze un sondaj aleator sau mixt. 

Timpul de realizare 

În cele mai multe situații practice, rezultatele unui sondaj trebuie obţinute 
într-un timp cât mai scurt, pentru că aceste rezultate fundamentează decizii 
concrete cu privire la fenomenul studiat. Timpul de realizare se diminuează în 
contextul anchetelor care se realizează cu o anumită frecvenţă (utilizând 
metodologia, infrastructura și rezultatele din anchetele anterioare). Sondajele 
empirice se pot realiza într-un timp mult mai scurt, în comparaţie cu cele aleatoare 
sau mixte. Criteriul timp poate fi decisiv, uneori, pentru alegerea unei metode de 
sondaj (caz în care se poate apela la o metodă empirică). 

Natura populaţiei de referință 

Deşi gradul de precizie, costul şi timpul de realizare a sondajului sunt 
criteriile care definesc eficienţa unei anchete, acestea nu pot fi evaluate fără a ţine 
seama de natura populaţiei. Acest criteriu poate restrânge plaja opţiunilor pentru un 
anumit tip de sondaj. Există situaţii când natura fenomenului sau a populaţiei de 
referință impune cu necesitate un anumit tip de sondaj (de exemplu, în situaţia în 
care nu există o bază de sondaj sau nu se cunosc informaţii suplimentare pentru 
populaţia de referință, când volumul populaţiei este necunoscut sau unităţile 
individuale se delimitează doar în momentul observării). 

Volumul eşantionului 

Cel puţin la nivel intuitiv, se poate considera că un sondaj este cu atât mai 
bun cu cât eşantionul este mai mare, dacă se respectă condiţiile de repre- 
zentativitate. Mărimea eşantionului este legată de metoda de sondaj aleasă și 
determină precizia rezultatelor, cel puţin până la un anumit nivel. În cazul 
sondajelor aleatoare, volumul eșantionului reprezintă o condiție importantă pentru 
precizia rezultatelor. De regulă, pentru aceste sondaje se impune o limită de 
precizie care determină volumul eșantionului. În general, sondajele aleatoare 
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presupun eșantioane de volum mare, ceea ce implică costuri ridicate şi un timp de 
realizare mai lung. Sondajele mixte, prin utilizarea unei informaţii suplimentare, 
pot reduce semnificativ volumul eșantionului, însă limita este stabilită de nivelul de 
precizie sau de cost. În cazul sondajelor empirice, nu există un criteriu ştiinţific de 
definire a volumului eșantionului. Limitarea acestuia reprezintă o condiţie impusă 
de cost şi de timpul de realizare. 


e. Definirea eșantionului 

Eşantionul reprezintă acea sub-populaţie extrasă din populaţia de referință 
conform metodei de sondaj alese şi care respectă principiul reprezentativității. 
Pentru un eşantion statistic sunt importante două caracteristici (volumul şi structura 
acestuia) care pot fi definite în contextul fiecărui tip de metodă de sondaj. 

Cazul sondajului aleator 

Eșantionul care rezultă în acest caz respectă în principal o condiţie de volum. 
Volumul eșantionului trebuie cunoscut a priori. Acesta se calculează în condiţii de 
probabilitate asumate și a unei erori de estimare fixate. Pentru eșantionul care va fi 
extras nu se impune o anumită structură, ci doar respectarea principiului selecției 
aleatoare, adică a extragerii unei unități cu probabilitatea de includere cunoscută și 
după o schemă de extragere probabilistă. Pentru sondajele aleatoare simple, 
probabilitatea de includere este aceeași pentru toate unităţile din populaţie. 
Extragerea eșantionului se realizează cu ajutorul unui algoritm și al unui generator 
de numere aleatoare. 

Cazul sondajului empiric 

Pentru aceste tipuri de sondaje, volumul eșantionului nu se poate calcula sau 
estima. În funcţie de tipul de sondaj empiric aplicat, specialiştii propun utilizarea 
unui volum al eșantionului care este stabilit fără apelul la metode şi principii de 
calcul, ci la expertiză şi practici anterioare. Eșantioanele obținute în acest caz au, 
de regulă, o structură bine stabilită în faza de elaborare a planului de sondaj. De 
exemplu, sondajul pe cote utilizează o serie de variabile care structurează 
populaţia, iar selecția presupune obţinerea unui eșantion cu o structură identică. 
Pentru că volumul eşantionului nu se poate calcula, în dimensionarea acestuia se 
apelează la opinia experților, la studiile realizate anterior şi la informaţiile 
disponibile despre populaţia de referință. 

Cazul sondajului mixt 

Sondajul mixt permite atât calculul volumului eșantionului, cât şi 
determinarea structurii acestuia. De exemplu, în cazul sondajului stratificat, 
eșantionul păstrează structura populaţiei de la nivelul straturilor, iar din fiecare strat 
se extrag aleator un număr de unități care se calculează a priori. 
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f. Erorile de eșantionare şi precizia rezultatelor 

Erorile de eşantionare şi precizia rezultatelor pot fi tratate separat în funcţie 
de principiul de selecţie utilizat: aleator şi empiric. 

Sondajul aleator şi mixt oferă posibilitatea măsurării erorilor de eșantionare. 
Instrumentele care asigură măsurarea acestor erori, precum şi extinderea rezul- 
tatelor de la eşantion la populaţia totală, sunt estimatorii, adică variabile aleatoare 
construite pe mulțimea tuturor eșantioanelor posibil de extras dintr-o populaţie. 
Proprietăţile estimatorilor asigură posibilitatea măsurării erorilor de estimare, 
precum și realizarea unor teste care privesc calitatea rezultatelor sondajului. 

Precizia rezultatelor obținute în sondajele empirice nu poate fi apreciată 
decât intuitiv, pe baza criteriilor care au stat la baza eșantionării. Se poate realiza o 
precizie ridicată dacă populaţia este suficient de bine cunoscută după variabilele de 
control şi dacă eșantionarea se realizează în condiţii de calitate. În acest caz, 
decisivă este echipa care realizează eșantionarea și culegerea datelor. O cât mai 
bună instruire a operatorilor de teren și o cât mai detaliată procedură de identificare 
a unităţilor care compun eșantionul asigură şi șansele de a obține rezultate cu erori 
cât mai mici posibile. 


1.4. Probleme organizatorice 


Realizarea unei cercetări pe bază de sondaj statistic nu se limitează la 
construirea unui model de analiză şi a unui chestionar de culegere a datelor, ci 
presupune şi un efort organizatoric, care este unul foarte important pentru succesul 
cercetării. Dintre activităţile ce se referă la etapa de organizare a unui sondaj, 
selectăm următoarele: 

— stabilirea necesarului uman, atât specialişti, cât şi operatori şi angajarea 
acestora în cercetare; 

— stabilirea mijloacelor materiale necesare pentru desfășurarea anchetei; 

— stabilirea costurilor şi realizarea unui buget al anchetei; 

— realizarea calendarului de desfăşurare a activităților cercetării prin sondaj; 

— stabilirea modalităţilor de verificare şi control a activităţilor. 


1.4.1. Asigurarea necesarului uman 


Personalul care participă la realizarea unei anchete prin sondaj este compus 
din mai multe categorii: personal specializat, operatori, personal administrativ. 


a. Personalul specializat 

În general, o anchetă prin sondaj este alcătuită dintr-o echipă inter- 
disciplinară care are un coordonator ştiinţific. Dimensiunea și componenţa echipei 
este dictată de tema şi amploarea anchetei. De exemplu, în cazul unei teme de 
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cercetare care vizează opinia populației cu privire la activitatea unui primar, echipa 
specializată poate cuprinde: statisticieni şi sociologi. 

Statisticienii au în special rolul de a elabora planul de sondaj și de a realiza 
analiza datelor, însă au o contribuţie importantă și la elaborarea modelului de 
analiză și construirea chestionarului, precum şi în elaborarea raportului de 
cercetare. 

Sociologii joacă un rol important în etapa de definire a temei, în etapa de 
documentare, problematizare, operaţionalizare a conceptelor, în formularea 
obiectivelor şi ipotezelor cercetării, în elaborarea chestionarului, în selectarea Şi 
instruirea operatorilor. De asemenea, sociologii participă la etapa de analiză a 
datelor şi în realizarea raportului de cercetare. 

Personalul specializat implicat în anchetă poate fi personalul angajat 
permanent al unei instituţii sau poate fi şi personal angajat temporar în cercetarea 
respectivă. Selecţia personalului cade în sarcina directorului de proiect. 


b. Operatorii 

Operatorii sunt persoanele angajate temporar în anchetă pentru a realiza 
etapa de observare sau de culegere a datelor. Funcţia acestora constă în 
administrarea eficientă a chestionarelor, astfel încât erorile de observare să fie cât 
mai reduse. În general, institutele de sondaj îşi realizează o rețea de operatori pe 
teritoriul unei ţări sau a unei arii geografice. Această reţea este constituită ca 
urmare a unui proces de selecţie şi formare. 

Selecţia operatorilor se face în funcţie de anumite trăsături: 

— fizice, care se referă la aspectul plăcut, vârsta tânără, îmbrăcăminte decentă 
ete: 

— psihice, care au în vedere capacităţile de comunicare ale persoanei, echilibrul 
şi capacitatea de a nu influenţa persoana care răspunde la întrebări etc.; 

— morale, care se referă la corectitudine şi onestitate în realizarea sarcinilor 
acordate. 

Formarea operatorilor este activitatea care vizează o bună pregătire a 
acestora în vederea culegerii datelor. În munca de instruire, operatorii trebuie să-şi 
însușească temeinice cunoştinţe despre: 

— tema şi obiectivele anchetei; 

— conţinutul chestionarului şi forma sa; 

— modul de completare a fiecărei întrebări; 

— modul de utilizare a informaţiilor suplimentare care se oferă în timpul 
administrării chestionarului; 

—  consemnele de identificare a persoanelor care participă la anchetă; 

— timpul şi locul de completare a chestionarului; 
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— participarea la activitatea de control; 
— etc. 


c. Personalul administrativ 

Această categorie de personal are un rol important în organizarea şi desfă- 
şurarea activităţii de cercetare, asigurând funcţionalitatea echipamentelor, nece- 
sarul de materiale şi instrumente etc. Personalul administrativ poate fi compus din: 

— managerul proiectului de cercetare sau directorul de proiect, care asigură 
administrarea fondurilor şi buna desfăşurare a activităţilor; 

— administratorul echipamentelor informatice, care asigură funcţionalitatea la 
parametri normali a rețelelor, a computerelor şi a celorlalte echipamente 
necesare; 

— secretarul / tehnoredactorul, care asigură comunicarea, munca de editare a 
materialelor necesare anchetei; 

— etc, 


1.4.2. Asigurarea mijloacelor materiale și financiare. Bugetul anchetei 


Mijloacele materiale necesare într-o anchetă prin sondaj pot fi structurate în 
următoarele categorii: echipamente informatice, publicaţii, baze de date, 
consumabile, mijloace materiale auxiliare. 


a. Echipamente informatice şi de calcul 

În această categorie putem menţiona computerele dotate cu softul necesar, 
precum şi echipamentele periferice necesare: imprimante, scanere etc. Dacă 
sondajul este organizat de o firmă de specialitate, această dotare poate să existe în 
prealabil şi se pot face doar activități de upgrade / actualizare, atât pentru 
echipamentul hard, cât şi pentru soft, sau se pot adăuga şi alte echipamente noi care 
sunt achiziționate în etapa de pregătire a sondajului. 

b. Cărţi şi diverse publicaţii 

Atât activitatea de pregătire a sondajului, cât şi cea de realizare efectivă pot 
necesita o serie de documente din care se pot desprinde informaţii importante. 
Pentru documentare se pot utiliza biblioteci și surse de informaţii care nu implică 
costuri, dar uneori se impune achiziționarea unor materiale specifice (cărți, rapoarte 
de cercetare din alte studii, reviste etc.) 


c. Baze de date 

Sondajele statistice, în funcție de planul de sondaj ales, pot impune utilizarea 
şi chiar achiziționarea unor baze de date. Aceste date pot fi disponibile în sistemul 
statisticii oficiale sau la nivelul unor firme specializate. Frecvent, asemenea baze 
de date se obțin contra cost, cu o structură și un volum bine determinate. De 
exemplu, o bază de sondaj pentru un sondaj aleator la nivelul firmelor de 
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construcţii dintr-o anumită regiune geografică a unei țări nu este disponibilă decât 
în cadrul sistemului oficial (statistic sau fiscal) sau la nivelul unei firme de 
specialitate care a reușit să construiască şi să întrețină la zi o asemenea bază de 
date. Pentru un asemenea sondaj, o soluţie este cumpărarea unei baze de date care 
să reprezinte lista unităților deja selectate pentru a constitui eşantionul. 

d. Consumabile. Mijloace materiale auxiliare 

Pentru anchetele mari, materialele consumabile nu sunt neglijabile (hârtie, 
mapele operatorilor, elemente de promovare, toner etc.). De asemenea, materialele 
auxiliare pot fi consistente dacă arealul anchetei este unul semnificativ. În această 
categorie pot intra echipamentele de comunicare (telefoane, pagere etc.) şi mijloa- 
cele de transport (maşini) şi de cazare. Pentru munca de teren, trebuie să se asigure: 
comunicarea cu operatorii, pentru a realiza informarea şi controlul activităţii 
acestora; mijloacele de deplasare a operatorilor, caz în care fie se dispune de 
mijloacele firmei, fie se închiriază anumite mijloace de transport, fie se asigură căi 
facile de transport cu mijloacele puse la dispoziţie de firmele specializate; 
mijloacele de cazare şi de masă ale operatorilor (îndeosebi atunci când operatorii 
trebuie să se deplaseze în alte localităţi). 


e. Bugetul 

Pe baza necesarului de personal și de materiale, se trece la stabilirea 
cheltuielilor necesare unei anchete. Instrumentul de bază care asigură delimitarea 
tipurilor de cheltuieli şi, în final, a costului total şi a celui unitar este bugetul 
anchetei. 

Pe baza elementelor din buget, se determină următoarele costuri: 

-— capitole sau tipuri de costuri: costuri cu salariile, cu echipamentele etc.; 
_ costul total, ca sumă a tuturor costurilor pe capitole sau pe tipuri de costuri; 
— costul unitar (c), care se obţine împărțind costul total (C) la volumul 

eşantionului sau la numărul de chestionare administrate (n). 

Constrângerile de cost sunt importante în realizarea oricărui sondaj. Cel mai 
adesea, se cunoaște suma disponibilă pentru realizarea anchetei. Această sumă, ce 
joacă rolul de cost total, poate determina tipul de sondaj şi volumul eșantionului. 
Dacă nu este impusă o sumă, prioritare vor fi celelalte criterii care decid metoda de 
sondaj şi, în final, volumul eșantionului: precizia dorită, informaţia disponibilă etc. 

Un exemplu de structură de buget pentru o anchetă se prezintă în tabelul 1.3. 
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Tabelul 1.3. Bugetul unui sondaj 
Cheltuieli Unitate Număr Cost Cost 
de unităţi | unitar | total 
1. Resurse umane 
1.1. Salarii (sume brute) 
1.1.1. Personal administrativ oră 
1.1.2. Personal specializat (echipe de specialişti) oră 





1.1.3. Operatori 


chestionar 


dj, 




















1.1.4. Consultanţi oră 
Subtotal Resurse umane | 
2. Date şi informaţii 
2.1. Cărţi şi publicaţii buc. 





2.2. Baze de date 





Subtotal Date şi informaţii 





3. Echipamente şi consumabile 
3.1. Office echipament 

3.2. Soft 

3.3. Consumabile 

3.4. Altele 


Subtotal Echipamente şi bunuri 


4. Costuri aferente proiectului 












































4.1. Costuri transport, cazare şi muncă de teren persoană 
4.2. Costuri utilităţi lună 
ei 
Subtotal Sediu local / costuri aferente proiectului 
5. Alte costuri, servicii | i) 
5.1. Publicaţii abonament 
5.2. Traduceri pagină 
5.3. Tipărire chestionare şi alte materiale pagină 
5.4. Alte costuri 
Subtotal Alte costuri, servicii Ț 
6. Subtotal costuri directe aferente proiectului (1.- 5.) | 





7. Costuri administrative 2% 





8. Total costuri eligibile aferente proiectului (6. + 7.) 





9. Costuri neprevăzute 2% 








10. Total costuri (8. + 9.) 
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1.4.3. Calendarul cercetării 


Fiecare activitate din programul de cercetare are un loc şi un timp de 
realizare. Cercetarea prin sondaj este un şir sau lanţ de operaţiuni care necesită un 
timp minim de realizare. Estimarea acestor timpi şi organizarea lor într-un întreg 
coerent al programului de cercetare se concretizează în calendarul sondajului 
statistic. Pentru realizarea acestui instrument trebuie luat în considerare că, în 
general, în practică, timpul estimat cercetării este depăşit cu un procent de până la 
150% (Warwick şi Lininger, 1975, p. 35). 

Eficienţa sondajului presupune ca timpul de realizare a anchetei să fie cel 
mai scurt posibil. În general, pentru fiecare activitate se stabileşte un interval de 
timp care poate oscila între un minim și un maxim, deoarece pot interveni şi 
anumite probleme, însă se urmăreşte atingerea limitei inferioare a intervalului. 
Respectarea termenelor pentru fiecare activitate este deosebit de importantă, 
deoarece există activităţi care se succed, iar realizarea lor în timpul prevăzut 
asigură mersul normal al cercetării. 

Pentru gestionarea timpului în desfăşurarea activităților cercetării este util să 
se folosească un instrument de management al timpului și al ordinii activităților, 
așa cum este diagrama Gantt. 

Diagrama Gantt conţine o listă cu toate activităţile ce presupun realizarea 
sondajului, împreună cu timpul alocat fiecăreia. Unităţile de timp trebuie să fie 
alese corespunzător, astfel încât să poată fi evaluat cât mai bine timpul alocat 
fiecărei activităţi. O serie de activităţi se pot realiza în paralel, iar altele presupun o 
ordine logică. De asemenea, unele activități depind de rezultatele activităţilor 
anterioare. Aşa cum se observă din exemplul prezentat în tabelul 1.4, diagrama 
Gantt face posibilă delimitarea activităţilor, succesiunea lor, inclusiv realizarea în 
paralel. Tot în diagramă se precizează volumul de timp necesar pentru fiecare 
activitate, precum şi timpul total. 


Tabelul 1.4. Model diagramă Gantt pentru un sondaj de opinie 





Activitate 





Definire problemă. Model de analiză 
Elaborare chestionar 
Plan de sondaj 











Organizare anchetă 
Culegere date 
Analiză date 
Raport cercetare 
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În tabelul de mai sus, activităţile sunt prezentate la nivelul cel mai înalt de 
sinteză, în ipoteza realizării anchetei în două săptămâni, a câte şase zile de lucru 
fiecare. De regulă, asemenea diagrame se realizează mai detaliat, pe activități 
specifice la nivelul fiecărei etape a cercetării, pentru a gestiona cât mai eficient 
timpul. 


1.4.4. Organizarea spaţiului 


În general, anchetele prin sondaj se realizează pe spaţii mari: pe teritoriul 
unei ţări, al unei zone (zonă de dezvoltare, regiune istorică, judeţ, zonă rurală sau 
agricolă), al unui oraş (structurat pe cartiere sau zone, pe străzi etc.). Organizarea 
anchetei presupune şi o atentă organizare a teritoriului în care se desfăşoară 
procesul de culegere a datelor. În acest sens, trebuie rezolvate următoarele 
probleme: asigurarea informaţiilor despre teritoriul anchetei, repartizarea 
operatorilor și stabilirea itinerariilor. 

Instrumentul de lucru pentru această etapă este harta anchetei. Această hartă 
are la bază harta fizică sau cea turistică a teritoriului pe raza căruia se realizează 
ancheta. Pe această hartă se detaliază apoi unități de spaţiu, itinerarii şi puncte de 
control necesare unei bune desfășurări a etapei de culegere a datelor. 

Asigurarea informaţiilor despre teritoriu se realizează prin cercetarea de hărți 
cu infrastructura şi clădirile; prin analiza posibilităţilor de transport (documente 
informative emise de societăţile de transport) şi a celor de cazare (hoteluri, 
pensiuni, case de vacanţă etc.). 

Repartizarea operatorilor este foarte importantă în special în cazul anchetelor 
care presupun o mobilitate ridicată. Pentru operatori se stabilesc foarte precis 
itinerariile pe care trebuie să le urmeze în procesul de culegere a datelor, rutele şi 
mijloacele de transport care se utilizează, locurile şi perioada de cazare. 

Aceste informaţii detaliate pot face parte din fişele de operator pentru a 
facilita procesul de culegere a datelor pe teren. Pentru fiecare operator se fixează 
un anumit teritoriu în care se realizează ancheta şi se oferă toate informaţiile 
necesare pentru a ajunge la unităţile care au fost extrase în eşantion sau care pot 
participa la anchetă. 


1.5. Exerciţii 


1. Prezentaţi câteva dintre avantajele şi limitele cercetării pe bază de sondaj 
statistic. 


2. Caracteristica esențială a unui sondaj este reprezentativitatea. Prezentaţi 
câteva dimensiuni ale conceptului și maniera în care s-a dezvoltat înţelegerea 
despre reprezentativitatea unui sondaj. 
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3. Exemplificaţi etapele cercetării prin sondaj în contextul unui studiu 
privind comportamentul consumatorului de cafea. 


4. Operaţionalizați conceptul de comportament al consumatorului de cafea, 
exemplificând pe cazul unei populaţii mai omogene, cum ar fi cea a studenților 
dintr-un oraş universitar. 


5. Elaboraţi două ipoteze în contextul unui studiu privind comportamentul 
consumatorului de cafea al studenţilor din orașul lași. 


6. Formulaţi o întrebare de opinie, una de date factuale şi una de motivaţie 
pentru un chestionar ce este utilizat într-o anchetă privind comportamentul 
consumatorului de cafea. 


7. În contextul anchetei menţionate la exerciţiul anterior, precizați ce metodă 
de elaborare a structurii chestionarului se poate utiliza. 


8. Aplicând criteriile de alegere a unei metode de sondaj, argumentaţi 
alegerea unui tip de sondaj care respectă criteriul de eficiență în contextul unui 
studiu privind comportamentul consumatorului de cafea în orașul laşi. 


9. Pentru același exemplu de anchetă de la exerciţiul anterior, realizaţi un 
model de buget, după ce s-a optat pentru un tip de sondaj. 


10. În condiţiile unei anchete definite la exercițiul 7, să se realizeze o 
diagramă Gantt pentru a prezenta activitățile cerute de anchetă și timpul necesar 
desfășurării acestora. 


11. În cazul unui sondaj empiric, ce criterii se pot utiliza pentru stabilirea 
volumului eşantionului? 


12. În care dintre situaţiile prezentate mai jos se poate organiza un sondaj 
statistic? 
— evaluarea opiniei persoanelor care au emigrat din România despre situația 
politică existentă în țară; 
— studiul violenţei domestice în mediul rural din România; 
— analiza comportamentului consumatorilor de droguri din București; 
— opinia germanilor cu privire la un nou model de autoturism. 


13. Ce variante de asigurare a reprezentativităţii unui eşantion există pentru 
o anchetă de opinie politică la nivelul populaţiei orașului Bucureşti? 


14. Prezentaţi câteva modalităţi de a construi baze de sondaj la nivelul 


persoanelor. 
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15. Ce presupune etapa de conceptualizare în cadrul demersului unei 
cercetări științifice? 
16. Prezentaţi câteva modalităţi de reducere a erorilor de eșantionare în cazul 


realizării unei anchete la nivelul gospodăriilor din mediul rural din România 
privind nivelul de sărăcie. 


17. Exemplificaţi și explicați diferența dintre un sondaj statistic şi selectarea 
„la întâmplare” a unui număr de unităţi dintr-o populaţie, pentru a culege informaţii 
pe o anumită temă. 


sase 





| 
| 
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| 


Capitolul 2 


SONDAJUL ALEATOR SIMPLU 


Cea mai cunoscută metodă de sondaj probabilist poartă numele de sondaj 
aleator simplu. Sondajul aleator reprezintă metoda de cercetare care are la bază un 
principiu de selecție stocastic. Extragerea eșantionului reprezintă un eveniment în 
cadrul unei experienţe aleatoare pentru care se poate realiza calculul probabilității 
de apariţie a unui eșantion, precum şi calculul probabilității de includere a unei 
unităţi din populaţie în eșantion. Selecţia se poate realiza asigurând aceeași 
probabilitate de includere în eșantion fiecărei unități din populaţie (cazul sondajului 
aleator simplu) sau șanse diferite de includere (cazul sondajului cu probabilităţi 
inegale). 

În acest capitol ne propunem să oferim cititorului o prezentare a noțiunilor 
de bază, a procedeelor de selecţie şi a instrumentelor statistice utilizate în practica 
sondajelor aleatoare cu probabilități egale. Ne referim, în principal, la prezentarea 
estimatorilor statistici care se definesc, în acest caz, pentru a fi utilizaţi în probleme 
de estimare și testare cu privire la parametrii unei populaţii. 


2.1. Noţiuni și notații 

Aşa cum am subliniat deja, prin sondaj aleator simplu înţelegem metoda de 
sondaj care are la bază principiul extragerii aleatoare a unităţilor care compun 
eșantionul, respectând proprietatea de  echiprobabilitate sau condiţia de 
probabilitate egală a fiecărei unități din populaţie de a fi inclusă în eşantion. 
Această idee de selecție este echivalentă și cu cea de a conferi aceeași probabilitate 
unui grup de n unități din populaţie de a fi extrase sau aceeaşi probabilitate de 
extragere pentru fiecare eșantion posibil de obținut din populaţia de referinţă. 

Înainte de a intra în detaliile acestei metode, în debutul acestui capitol este 
util să fie prezentate câteva noţiuni şi notaţiile utilizate pentru individualizarea şi 
identificarea facilă a acestora pe parcursul lucrării. 
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2.1.1. Populaţie şi eşantion. Parametri și estimaţii 


Populaţia statistică mai este întâlnită şi sub numele de univers sau 
colectivitate. Reprezintă un agregat sau un ansamblu de unități individuale reale 
definite cu ajutorul unei caracteristici care determină apartenența fiecărei unităţi la 
întreg, având un referent spaţial şi temporal precis. Populaţia este de obicei notată 
cu simbolul P, iar volumul acesteia cu N, reprezentând numărul de unități 
individuale care compun întregul. Populaţiile pot fi structurate în părţi, numite sub- 
populaţii, cu ajutorul unor criterii utile pentru cercetarea ştiinţifică. De exemplu, un 
studiu la nivelul populaţiei României poate considera sub-populaţiile judeţelor, 
regiunilor sau mediului rural şi urban. 

Unităţile care compun populaţia se numesc unități elementare sau elemente 
ale populaţiei. Acestea pot fi simple (obiecte, persoane, evenimente etc.) sau 
complexe (firme, familii etc.) şi trebuie să fie bine definite şi ușor de identificat la 
nivelul întregului. Pentru unitatea statistică se mai utilizează și numele de individ. 
În contextul cercetării prin sondaj, se mai poate face distincția între unitatea 
statistică de observare şi unitatea de eșantionare. Prima face trimitere la unitatea 
care este supusă efectiv procesului de măsurare, iar cea de-a doua este legată de 
operaţia de eșantionare. Uneori cele două coincid (de exemplu, un student), iar 
alteori diferă (de exemplu, unitatea de eșantionare este o firmă, iar cea de observare 
este managerul). 

O cerință esenţială a sondajului aleator este aceea de a constitui o bază de 
sondaj (sampling fi-ame), adică o listă sau o bază de date cu toate unitățile 
individuale și cu un element de identificare ce ține cont de tipul şi natura populaţiei 
(pentru o firmă, de exemplu, numele sau codul fiscal, iar pentru o persoană, nume, 
adresă sau CNP). Baza de sondaj reprezintă instrumentul care permite aplicarea 
algoritmilor de extragere aleatoare a eşantionului. De asemenea, baza de sondaj 
poate conţine informaţii suplimentare despre populaţie, ce pot fi utile în etapa de 
eșantionare sau în cea de estimare pentru a creşte eficienţa sondajului. 

Cu privire la populaţiile statistice interesează studiul unor caracteristici sau 
trăsături care sunt surprinse cantitativ cu ajutorul variabilelor statistice. Variabilele 
reprezintă instrumente care îndeplinesc funcția de măsurare a trăsăturilor analizate. 
De regulă, acestea se notează cu ajutorul literelor latine majuscule X, Y, Z. 

La nivelul populaţiei, pentru o variabilă statistică X se definesc o serie de 
caracteristici numerice sau indicatori statistici, cum ar fi indicatorii tendinței 
centrale, ai dispersiei sau formei distribuţiei. Aceste mărimi reale fixe sunt, de 
regulă, necunoscute și poartă numele de parametri. În cercetările pe bază de 
sondaj, un obiectiv important îl reprezintă estimarea parametrilor cu ajutorul 
datelor obţinute la nivelul eşantionului. Parametrul este definit de valorile 
variabilei X la nivelul tuturor unităţilor populaţiei. De obicei, parametrul se notează 
cu litere greceşti (4, 77, g, A etc.). De exemplu, dacă notăm generic parametrul cu 
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9, atunci se poate scrie ca o funcţie de valorile variabilei la nivelul unităţilor 
individuale: 


D=] (o eoiasos ne) 


unde f este o funcție măsurabilă. 
Prezentăm mai jos câteva exemple de parametri utilizați în cercetările 
statistice. 
— Media populaţiei 
Parametrul medie se notează cu u şi este definit de relaţia: 


1 N 
BOD =n=2dxi 
i=1 


— Valoarea globală (totalul) 

În practică, apare frecvent situaţia de a estima un total, volumul sau valoarea 
globală (de exemplu, volumul vânzărilor sau al creditelor etc.). Pentru o variabilă X 
notăm foralul prin 1 şi se obţine ca sumă a valorilor individuale ale variabilei la 
nivelul populaţiei totale: 


Evident, 


— Moment iniţial de ordin k 
Ca o generalizare a mediei aritmetice, se defineşte parametrul moment inițial 


de ordin k: 
i N 
Uk = D, x; 
iz 


Pentru diverse ranguri (k = 2,3,...) se obțin parametri ce sunt utili în analiza 
statistică a distribuţiei unei populaţii sau în analiza legăturii dintre variabile. 
— Proporția 
Considerăm cazul unei variabile alternative (de tip Bernoulli): 


ge = 
Vl-r rr 
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Parametrul 7r reprezintă proporția sau ponderea unităţilor din populaţie care 
îndeplinesc o proprietate bine definită A. Rezultă: 


E AR 


unde M este numărul unităților din populaţie care îndeplinesc condiţia A. 
Ca o observaţie importantă, parametrul proporție reprezintă media variabilei 
alternative definite mai sus: 


E(X) = 


Cu alte cuvinte, estimarea unei proporții presupune respectarea unor condiții 
similare cu situația estimării unei medii. 
Pentru o variabilă alternativă, parametrul tozal este: 


N 


7= da =M 


= 
adică este egal cu numărul unităților din populaţie ce respectă proprietatea cerută. 
—  Varianţa 
Varianța populaţiei pentru o variabilă X se notează cu 0? şi este definită de 
relaţia: 


N 
V(X) == ei — pu)? 


sau 


N 
ja dat — pt? = EQX2) — [EGOP 
i=1 


i 


Pentru o variabilă alternativă, varianţa este de forma: 
V(X) = 0? =n(1—rn) 


— Abaterea standard 
O măsură a gradului de eterogenitate a unei populații în raport cu o variabilă 
X este abaterea medie pătratică sau abaterea standard. Aceasta se obţine ca 
rădăcină pătrată a varianţei: 


o =yV(X) 





























Sondajul aleator simplu TI 





— Coeficientul de variaţie 
Acest parametru reprezintă o măsură relativă pentru gradul de omogenitate a 
populaţiei şi se obține ca raport între abaterea standard şi media aritmetică: 


v = — 
u 
— Moment centrat de ordin k 
O generalizare a varianţei o reprezintă media abaterilor de ordin k, numit 
moment centrat de ordin k: 


ji 
gh) = DIG 250). 
i= 


Momentele de ordinul 3 şi 4 sunt utilizate pentru determinarea parametrilor 
distribuţiei unei populaţii (asimetria şi boltirea). 

Următorul concept fundamental în cercetarea pe bază de sondaj este 
eșantionul. Este notat cu s (de la selecție) şi are un volum care este notat cu n, 
reprezentând numărul de unități extrase din populaţie. Ca subansamblu de unităţi al 
populaţiei, eșantionul se obține în urma procesului de selecţie aleatoare care 
asigură echiprobabilitatea participării la eșantion a tuturor unităţilor din populaţie. 

Un corespondent al caracteristicilor numerice de la nivelul populaţiei la 
nivelul eșantionului îl reprezintă estimariile sau valorile de sondaj. O estimaţie se 
obţine la nivelul unui eşantion extras, pe baza datelor culese, şi este o funcţie a 
valorilor unei variabile (A) înregistrate prin sondaj: 


estimaţia = g(x4, X3, ---,Xn) 


Estimaţiile se notează cu litere latine, iar pentru parametrii definiţi mai sus 
corespund următoarele: 
— Media de eșantion 


n 


i=1 


.: 
ă = — 
N 


— Valoarea globală de eşantion (totalul) 
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— Moment iniţial de ordin k de eșantion 


1 
pik) > E 
n . 


— Proporția de eşantion 


unde m reprezintă numărul unităților din eșantion care îndeplinesc proprietatea A; 


—  Varianţa de eşantion: 
1 n 
sa: => (a — 7)? 
n 
iZ1 


În unele pachete program de statistică, prin varianță de eşantion (sample 
variance) se înţelege varianța modificată, calculată prin relaţia: 


1 n 
ŞIZ = e Al — x) 
i=1 


Pentru o variabilă alternativă, varianţa la nivel de eşantion este: 





s?2 = w(1—w) 


— Abaterea standard de eşantion 


PESR 


- Coeficientul de variaţie 
Ss 
V==— 
x 


— Moment centrat de ordin k de eşantion 


1 n 
st = 2) aia 
n . 
i=1 


Estimaţiile sunt mărimi reale şi cunoscute, caracteristici numerice calculate 
pe baza datelor de sondaj și stau la baza procesului de estimare a parametrilor. 


2.1.2. Procedee de selecție 


Procedeul de selecţie presupune o experienţă aleatoare ce oferă posibilitatea 
de a calcula probabilitatea de includere a fiecărei unități individuale a populației în 
eșantion și probabilitatea de a extrage un eșantion din mulțimea de eșantioane 
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posibil de extras. Selecţia aleatoare simplă, care asigură aceeași probabilitate de 
includere în eşantion pentru fiecare unitate din populaţie, se poate realiza cel puţin 
în trei moduri: selecție cu revenire, fără revenire şi sistematică. 


a. Selecţia aleatoare cu revenire 

Are la bază schema aleatoare a urnei cu bilă revenită. Din populaţie este 
extrasă o unitate, se înregistrează rezultatul, apoi unitatea este reintrodusă în baza 
de sondaj şi urmează o nouă extragere. În acest mod se asigură atât independența 
extragerilor, cât şi echiprobabilitatea lor. Fiecare unitate a populaţiei are aceeaşi 
şansă de a fi inclusă în eşantion, probabilitate ce se poate calcula după regula 
clasică. 

Numărul de eşantioane care se pot extrage cu revenire este: 


K = N" 


În extragerea aleatoare, se poate calcula probabilitatea de extragere a unui 
eşantion folosind regula clasică. Pentru selecţia cu revenire, această probabilitate 
este: 


i 
PO 


>s|= 


unde 


k 
p(5) =0,d ps) =1 
s=1 


Probabilitatea de includere a unei unităţi în eşantion poartă și numele de 
probabilitate de includere de ordinul întâi şi este definită astfel: 


pi =P(ies)i=1N 
Pentru studiul probabilităților, se poate defini variabila: 


rasi (upei es,i=1,N 
SI 0, în rest 


care admite proprietăţile: 
EUies) = pi; 
V(lies) = pi(1 — pi); 
— Pica lies n Xiapi=n. 


Deoarece suma probabilităților de includere nu este egală cu 1, acestea nu 
pot constitui o distribuţie probabilistă. 
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Se poate însă construi distribuția de probabilitate de forma: 


..9 


Joe 
n n n 


je 


i=i 


(PL 22, Pa) 


e 


Din cele de mai sus, deoarece probabilitățile de includere sunt egale, rezultă: 


n 


PPP 


Mărimea n/N poartă numele de rată sau fracție de sondaj. 

Probabilitatea de includere se poate calcula luând în considerare specificul 
extragerii aleatoare cu revenire. Probabilitatea de a extrage o unitate din populație 
la prima extragere este egală cu 1/N. Deoarece aceeași unitate poate intra în 
eşantion şi la a doua extragere, dacă urna nu se modifică, probabilitatea nu se 
modifică. Rezultă că, în total, în cele n extrageri, probabilitatea ca o unitate anume 


să participe la eşantion este: 
n 
zi 1 i sura A 5 1 _n 
N N LN N 


Extragerea cu revenire are îndeosebi o valoare teoretică ce permite 
construirea instrumentelor statistice necesare pentru procesul de estimare. În 
practică, se preferă extragerea fără revenire deoarece nu are sens extragerea unui 
eşantion care să conţină o unitate de mai multe ori. La limită, dacă populaţia de 
referință are un volum foarte mare, se poate accepta acest procedeu de selecţie ca 
unul de referinţă. 


p = 


z|— 


Exemplu 

Dintr-o populaţie de studenţi a unei universități (N = 30000) se extrage 
aleator simplu cu revenire un eșantion de volum n = 300. 

Numărul de eșantioane posibil de extras este K = 30000%%, iar 
probabilitatea de extragere a unei unităţi în eșantion este: 


n 300 1 


P = N 30000 - 100 


b. Extragerea aleatoare fără revenire 

În acest caz, se apelează la schema probabilistă a urnei cu bilă fără revenire. 
Adică, după ce o unitate este extrasă din urnă, este înregistrată și rămâne în afara 
urnei. Procedeul continuă până la extragerea tuturor celor n unități din populaţie, 
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respectând aceeași schemă. In acest caz, numărul posibil de eşantioane care pot fi 
extrase este dat de relația: 


a n 
K = CN 
Pentru selecția fără revenire, probabilitatea de extragere a unui eşantion este: 


1 1 


p(5) = > ca 


unde 


k 
p(5) 20,9 p(s)=1 
s=1 


În acest caz, pentru probabilitățile de includere, pe lângă cele de ordinul 
întâi, sunt importante probabilitățile de ordinul doi: 


py = P(iesnjes)izj,i,j = |N 
Pentru probabilitățile de includere de ordinul doi se pot defini variabilele 


indicatoare: 


; _(1pties,jes,izj,i,j = UN 
IESE O, în rest 


unde 


N N 
d lies,jes = (n — 1)lies = >. pij = (n — I)pi 
Îi 2 


NN NN 
di ies. jes = n(n — 1)=> 2 duPu = n(n — 1) 
j= 


i=1 i=1 j=1 


Pentru acest caz se poate demonstra că probabilitatea de ordinul întâi rămâne 
constantă pe tot parcursul extragerii, adică se păstrează condiţia de echi- 
probabilitate. De exemplu, aplicând regula clasică, probabilitatea ca o unitate din 
populaţie să intre în eșantion este dată de relația: 





pi >=p= CE N 


În schimb, probabilitatea de ordinul doi se poate calcula astfel: 


aa n(n — 1) 
PU = N 
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Exemplu 

Dintr-o populaţie de studenţi a unei universităţi (N = 30000) se extrage 
aleator simplu fără revenire un eșantion de volum n = 300. 

Numărul de eşantioane posibil de extras este K = C309op, iar probabilitatea 
de extragere a unei unităţi în eşantion este: 


_n 300 1 
P N 2 30000 100 

c. Selecţia sistematică 

În practică, există situaţii în care este dificil de obținut o bază de sondaj (un 
exemplu tipic este cazul sondajelor din ziua alegerilor) şi, prin urmare, de aplicat 
un algoritm de extragere aleator simplu așa cum am arătat mai sus. Dacă la nivelul 
populaţiei unităţile statistice pot fi identificate uşor în procesul de observare și se 
consideră că ordinea acestora la nivelul populaţiei este una aleatoare (de exemplu, 
venirea la vot a cetăţenilor de pe listele electorale), atunci se poate realiza selecţia 
după un procedeu simplu care poartă numele de extragere cu pas de numărare sau 
sistematică. 

Dacă se cunoaşte volumul eșantionului (n) și volumul populaţiei (N), ideea 
este să se calculeze un pas de numărare: 

N 
PAS = — 
n 

Pasul reprezintă instrumentul de selecţie și este distanța dintre două unităţi 
din populaţie care sunt incluse în eșantion cu ajutorul acestei metode. Extragerea 
eşantionului presupune alegerea în mod aleatoriu (cu ajutorul unui algoritm de 
selecţie) a unei prime unități de extragere din populaţie, iar apoi se aplică pasul de 
numărare pentru identificarea celorlalte n — 1 unități. Utilizarea pasului asigură 
parcurgerea întregii populații şi se evită selecţiile multiple. 

Metoda dă rezultate bune şi în cazul în care nu se cunoaşte exact volumul 
populaţiei (de exemplu, cazul clienţilor unui magazin), ci doar se poate face o 
apreciere. În schimb, cunoscând volumul eșantionului, se poate fixa un pas de 
numărare care să asigure selecția numărului dorit de unități. 


Exemplu 

Dintr-o populaţie de studenţi a unei universități (N = 30000) se extrage 
aleator simplu un eșantion de volum n = 300 după metoda pasului de numărare. 
Conform metodei, pasul de numărare este: 
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Dacă se extrage aleator o primă unitate din primele 100 de unităţi, de 
exemplu unitatea 65, atunci următoarea unitate selectată în eșantion este 165 etc. 


2.1.3. Selecţii aleatoare. Estimatori. Distribuţii de selecție 


Pentru înţelegerea detaliilor care privesc eșantionarea aleatoare simplă, 
considerăm cazul selecţiilor aleatoare cu revenire. Modificările care apar în cazul 
selecției fără revenire vor fi precizate punctual în capitolele următoare, în discuţia 
legată de estimarea parametrilor unei populaţii. Prezentăm mai jos, punctual, 
principalele instrumente care se construiesc în contextul selecţiei aleatoare cu 
revenire. 


a. Variabile aleatoare de selecţie 

Din perspectiva teoriei selecţiei (un capitol al statisticii matematice), 
extragerea aleatoare a unui eșantion reprezintă o experienţă aleatoare care 
presupune o mulțime de evenimente elementare (notată de regulă cu 0). Numărul 
total de eșantioane posibil de extras este: 


K = N" 


Pentru o variabilă X, un eșantion posibil de extras reprezintă un set de n 
valori dintre valorile posibile ale variabilei care rezultă în urma selecţiei. Cele K 
eşantioane aleatoare posibil de extras pot fi analizate împreună ca n realizări 
structurate astfel: 


X14 X12 .... Xin 
Xa Xa2 sm: Xa2n 
XK1 XR2 «e: XKn 
(A pe ra Aa) 


Fiecare linie din structura matriceală de mai sus reprezintă un eșantion 
posibil sau valorile posibile ale variabilei X organizate sub formă de eşantioane 
posibil de extras. Dacă pentru fiecare coloană din matrice se defineşte o variabilă 
aleatoare (care are ca valori posibile valorile lui X pentru prima unitate din toate 
eşantioanele posibil de extras), rezultă o structura matematică de tip vector aleator 
care se defineşte astfel: 


i CX ata) 


unde variabilele X; se numesc variabile aleatoare de selecţie. 

Se poate demonstra că variabilele aleatoare de selecţie construite prin 
schema probabilistă prezentată mai sus sunt identic repartizate cu variabila X (au 
aceeaşi lege de probabilitate, deci aceeași parametri ai distribuţiei) şi sunt 
independente probabilistic. 
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Așadar: | 
EG) = EQ) 
V(ă) = VA) | 
i= Tin | 


Rezultă că un eșantion poate fi privit ca o selecţie de volum n, adică o 
realizare posibilă a unei experienţe aleatoare sau o valoare posibilă a vectorului 
aleator V: 





js Da eee at en) 


Exemplu 

Dintr-o populaţie compusă din numerele naturale de la 1 la 6 se extrag 
aleator un număr de 36 de eşantioane formate din 2 numere, adică K = 62 
eşantioane posibil de extras. Aceste eșantioane sunt prezentate în tabelul de mai 
Jos. 
























l 


b. Statistici 

O statistică este o variabilă aleatoare obţinută ca o combinaţie a variabilelor 
aleatoare de selecţie X;. Dacă notăm o statistică cu S, aceasta se obţine cu ajutorul 
unei funcţii numărabile g care compune elementele vectorului V: 


S=goV 








De exemplu, dacă aplicaţia g este o medie, se obţine statistica: 


care este o variabilă aleatoare ale cărei valori posibile sunt mediile tuturor 
eşantioanelor de volum n posibil de extras din populaţia W. 
O asemenea valoare posibilă a statisticii S este media de eşantion: 


n 
1 
= 
n 4 
i=1 
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c. Distribuţia de selecţie 

Statisticile sunt variabile aleatoare construite cu ajutorul selecțiilor de volum 
n sau a eșantioanelor posibil de extras dintr-o populaţie respectând principiul 
echiprobabilităţii. Ceea ce interesează cu privire la aceste variabile aleatoare este 
legea de probabilitate. Distribuţia probabilistică a unei statistici se numeşte 
distribuţie de selecţie. 

Pentru statisticile mai frecvent utilizate în analiza statistică se determină atât 
legile de distribuţie, cât şi proprietăţile acestora. Pentru eșantioane de volum mare 
(aşa cum sunt cele obţinute pentru sondajul aleator simplu), unele proprietăţi sunt 
acceptate ca proprietăți limită (asimptotice). 


d. Estimatorii statistici 

Pentru fiecare parametru de estimat se identifică o statistică ce îndeplineşte o 
serie de condiţii de calitate. Estimarorul este o statistică aleasă sau construită 
convenabil pentru fiecare parametru al populaţiei. Estimatorul se notează cu litere 
greceşti care corespund parametrilor, având însă deasupra simbolul “ * ”. 

De exemplu, pentru parametrul 8, notăm estimatorul cu 6. Acesta reprezintă 
o combinaţie a variabilelor aleatoare de selecţie, ca și în cazul statisticilor: 


Î so CA tea a) 


Funcţia g se alege în procesul de identificare a celui mai bun estimator, adică 
a statisticii care respectă un set de proprietăți privind calitatea rezultatelor. 

Estimatorul este instrumentul principal care permite estimarea unui 
parametru. Calitatea procesului depinde de proprietăţile estimatorilor (care vor fi 
prezentate mai Jos). 


e. Erori de estimare 

De regulă, există o diferenţă între o estimaţie şi parametrul pe care îl 
estimează, ceea ce reprezintă o eroare de estimare. Această eroare poate fi evaluată 
cu ajutorul proprietăţilor estimatorilor. 

Pentru definirea proprietăţilor estimatorilor, este important să se pornească 
de la o măsură a erorii de estimare care se numeşte eroarea medie pătratică (0 
medie a abaterii valorilor estimatorului de la parametru): 


E(6 - 0) =v(8)+[e(6)-e 


In relaţia de mai sus, expresia 


v(6) = E(8-E(9)) 


So Sondajul statistic 


este varianța estimatorului (o măsură a gradului de împrăştiere a valorilor sale 
posibile faţă de media lor sau faţă de media estimatorului), iar expresia 


B(8) = E(6)-8 


reprezintă deplasarea sau biais-ul estimatorului. 

O bună estimare statistică impune ca eroarea de estimare de mai sus să fie 
minimă (ea este practic zero dacă estimaţia este identică cu parametrul), adică o 
varianță minimă şi un biais minim. 

O altă măsură a erorii de estimare se numește eroare maxim admisibilă sau 
eroare limită. Eroarea limită este acea eroare care are la bază legea de distribuţie a 
estimatorului şi reprezintă eroarea maxim admisibilă a unui estimator: 


Ag =t:0g 


unde: 
—_t reprezintă un coeficient de probabilitate care se determină în funcţie de 
distribuţia de selecţie a estimatorului şi probabilitatea cu care se doreşte 
garantarea rezultatelor (această probabilitate este fixată de cercetător); 


— 03= Iv(8) reprezintă abaterea medie pătratică a estimatorului. 


De obicei, în expresia abaterii medii pătratice, apar parametrii distribuţiei de 
selecţie a estimatorului, care depind de parametrii populaţiei totale. Cum aceşti 
parametri nu sunt cunoscuţi, intervine problema estimării erorii limite, adică 
estimarea preciziei cu care se garantează rezultatele. 

În practică, această eroare limită se fixează de către cercetător pentru a 
calcula apoi volumul eșantionului care să permită estimarea parametrilor în aceste 
condiţii de eroare maxim admisă. 


f. Proprietăţile estimatorilor 

Estimarea statistică se realizează în baza următoarelor proprietăţi mai 
importante ale estimatorilor: nedeplasare, convergenţă în probabilitate, eficienţă, 
convergenţă în repartiție. 

Nedeplasarea 

Un estimator se numeşte nedeplasat sau bine centrat (fără biais) dacă media 
sa este egală cu parametrul sau deplasarea este nulă: 


E(6) = 0 sau B(0) =0 


Proprietatea de nedeplasare presupune ca estimatorul să aibă ca tendinţă 
centrală parametrul și nu o altă valoare. A respecta această condiție înseamnă a 
spune că parametrul reprezintă speranța matematică a estimatorului (o valoare cu 
probabilitate de apariție mare - cea mai mare dacă distribuţia este simetrică). 


























| 
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Există situaţii când estimatorul este deplasat, dar deplasarea devine 
neglijabilă la un volum al eşantionului suficient de mare (vorbim despre un 
estimator asimptotic nedeplasat). Deplasarea depinde de parametru, ca atare este 
necunoscută. Deoarece parametrul este estimat pe baza datelor de la nivelul unui 
eşantion, rezultă că şi deplasarea este estimată, valoarea sa reală fiind necunoscută. 

Nedeplasarea poate fi privită şi ca o proprietate asimptotică. Astfel, 
estimatorul 6 se numeşte asimptotic nedeplasat pentru parametrul 9 dacă: 


Lire ca E(6) = 0 sau lim„_o» B(n,0) = 0 


Convergenţa în probabilitate 
Această proprietate impune o condiţie de volum a eşantionului: dacă acesta 
este suficient de mare, atunci orice valoare posibilă a estimatorului (orice estimaţie) 


converge către parametru. Această proprietate se poate scrie astfel: 
(6 0 
N/neN 


sau 
P(ve > 0, 3ns, n > ne, |6,—0|<.)=1 


Proprietatea de convergență prezentată mai sus este o variantă a celebrei legi 
statistice numite /egea numerelor mari şi mai poartă numele de consistență slabă. 

Sondajele aleatoare impun o condiţie de volum care este cerută de această 
proprietate. În practică, acest lucru se traduce în necesitatea de a construi 
eşantioane mari pentru a asigura estimaţii de calitate. 


Observație 


Se poate demonstra uşor că, pentru un estimator 6, dacă sunt îndeplinite 
următoarele condiţii (condiţii suficiente pentru convergenţa în probabilitate): 


lim E(0) = 0 
a Po 


atunci estimatorul este convergent. 


Eficienţa 

Există situaţii când pentru un parametru se pot obţine mai mulţi estimatori 
(de exemplu, pentru o distribuţie Poisson). În aceste condiţii, apare problema 
alegerii celui „mai bun” estimator, deci a determinării unui criteriu de alegere a 
celui mai bun estimator. 

Conform inegalităţii lui Cebişev, pentru un estimator 6 care admite varianță 
are loc proprietatea: 
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v(6) 


g2 





P|(6 - 0) >] < (Ve >0 

Din această relaţie rezultă că un criteriu de alegere a estimatorilor este 
minimizarea varianţei acestora. 

Dintre doi estimatori posibili pentru un parametru, estimatorul cu varianţa 
cea mai mică se numeşte un estimator mai eficient decât celălalt (eficiență 
relativă). Dintre doi estimatori posibili pentru un parametru, este preferabil 
estimatorul cu varianța mai mică. Estimatorul cu varianţa minimă este un estimator 
eficient. 

Pentru un estimator eficient se respectă condiția: 


v(8) = E (6-E(8)) = min 


O modalitate de evaluare a acestei condiţii de minim o oferă inegalitatea 
Rao-Cramer. În această inegalitate apare varianța estimatorului şi cantitatea de 
informaţie pe care o aduce un eșantion aleator extras dintr-o populaţie pentru 
parametrul 8, notată cu 1(8). Inegalitatea este dată prin relaţia: 


A 1 
V(9) > 6) 


Dacă f este funcţia de probabilitate a variabilei X, este derivabilă de două ori 
în raport cu parametrul, iar X; sunt variabilele aleatoare de selecţie, atunci 
cantitatea de informaţie se obține prin relaţia: 


2 & 92 
(8) = E [3 If [n Xa sei Xa 2) = -E E DEF (Xp oii ai 0 


f(x Xa see Xni 6) = ] |rai 8) 
i=1 


poartă numele de funcție de verosimilitate a parametrului 9. 
Pentru un sondaj aleator, informaţia obţinută pentru un parametru 6 lao 
realizare a unui eşantion este de n ori informaţia obţinută de o singură observaţie: 


1„(8) = n1(8) 
2 


9 
I(0) = —E [2 Inf Că; | 


Condiţia de eficiență a unui estimator presupune condiţia de egalitate din 
relația Rao-Cramer. Atunci când varianța estimatorului respectă relaţia: 
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1 
In(8) 





v(6) = 


estimatorul 8 se numeşte eficient. 


Convergenţa în repartiție (teorema limită centrală) 
Această proprietate impune o condiţie de volum pentru combinaţia liniară a 
variabilelor aleatoare de selecţie X;, notată cu $,: 


n 
Sr = d. X; 

iz 
Prin standardizare se obține: 


$ Su = ES) 


e AS) 


Dacă volumul eşantionului creşte peste o anumită limită, atunci variabila 
aleatoare obținută prin standardizare urmează o lege de repartiție normală standard: 


(Snc = Z=N(0,1) 


Proprietatea se aplică cu ușurință tuturor estimatorilor care se obţin ca o 
combinaţie liniară a variabilelor aleatoare de selecţie. 


2,2. Statistici utilizate în cazul sondajului aleator simplu 


În acest subcapitol sunt prezentate o serie de statistici mai frecvent utilizate 
în cercetările pe bază de sondaj: media şi totalul de selecţie, proporţia de selecţie, 
varianța de selecţie. 


2.2.1. Media de selecţie 


Pentru fiecare statistică se vor prezenta definiţia și o serie de proprietăţi utile 
în analiza statistică. 


Definiţie 
Se numeşte medie de selecție statistica definită prin relaţia: 
n 
aa Ab 
ji = = ăi 
n 4 
i=1 


Valorile posibile ale acestei variabile aleatoare sunt mediile de sondaj ale 
tuturor eşantioanelor de volum n posibil de extras dintr-o populaţie. 

Pentru un eşantion extras v: (X4, X3, -.., Xp), media de selecţie ia o valoare 
care este media aritmetică de eşantion şi reprezintă estimația parametrului medie: 





SA Sondajul statistic 


n 
a => 
X = — Xi 
n 


i=1 


Dacă luăm în calcul mulțimea eșantioanelor posibil de extras, media de 
selecţie se poate prezenta ca o variabilă aleatoare ce admite câte o valoare pentru 
fiecare eşantion posibil de extras: 


X14 X12 .... Xin Xa 
X24 X22 .... Xon X> 
XKR1 XK2 see XKn E 


sau 
A: (a ze ce XR) 
Exemplu 


Pentru cele 36 de eșantioane prezentate anterior, media de selecţie presupune 
variabila aleatoare cu următoarele valori E 


2,5 
3.0 : S 
3,5 


Proprietăţi 
Media de selecţie admite o serie de proprietăţi, dintre care prezentăm câteva 
mai importante. 





















Media de selecție este un estimator nedeplasat pentru parametrul medie 
E(A) = u 
Demonstrația este relativ simplă şi se bazează pe proprietăţile variabilelor 


aleatoare de selecție X; (i = 1,n) - sunt identic repartizate cu variabila X şi sunt 
independente probabilistic. Rezultă că: 


E(ĂD = EG) = 
V(X) = VU) = 02 


In concluzie, 
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Media mediei de selecție se poate calcula și cu ajutorul probabilității de 
includere de ordinul întâi, pe baza variabilelor aleatoare care indică includerea în 
eşantion a unei unități. 

Putem scrie relaţiile: 


N N N N 
1 1 1 n 1 
EG) = E(2> al ies | = S XE (lies) = = 7 > 2 xi = 
i=1 i=1 i=1 


iZ1 
Exemplu 
Pentru cele 36 de eșantioane prezentate anterior, media mediei de selecție 
este: 
N 
= 2 1+2+3+4+5+6 Edd 
N e 5 
i=1 
K 
E(A) = dz = 126: ie 
AR PT ge 
j>=1 
Deci 


E(A) =u 
Media de selecţie este un estimator convergent pentru parametrul medie 


Conform teoremei lui Hincin, pentru variabile aleatoare de selecţie X; are loc 
proprietatea: 


P(ve > 0,anz,n > ne,lâ—ul > e) =0 


sau 
1 n 
p 
d XEO = 
Z 


Cu alte cuvinte, dacă volumul eșantionului este suficient de mare, orice 
valoare a estimatorului (orice medie de eşantion) se află în vecinătatea 
parametrului. Această proprietate este esenţială în cazul estimării mediei 
populației. Deoarece eşantioanele aleatoare respectă această condiţie de volum, 
proprietatea de mai sus se consideră îndeplinită. 


7 
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Media de selecţie este un estimator eficient pentru parametrul medie | 
Varianţa mediei de selecţie se obține distinct în funcție de tipul de extragere, | 
ceea ce implică utilizarea probabilităților de includere de ordinul întâi și doi. Pentru 
ambele situaţii însă, se poate demonstra că media de selecţie este un estimator 


eficient. | 
Notăm varianţa mediei de selecție astfel: | 


pa 2 
V(A) = 0 
Pentru extragerea cu revenire 


n n n 
Al a3ă i SP, 
di = [29] VO = 0 a a 
i=1 i=1 


i=1 





Să arătăm că estimatorul A este eficient, considerând că variabila X urmează 
o lege de distribuţie normală: X — N(u,02). Pentru această distribuţie au loc 
relațiile: 
= Eu 








in Ade i i 2) ie 
n de = n e 20 = —in0 
fn OV 21 


2 _ (=) 
3 i GA) ae 











= 1 
dz a zInf (xn) = — az 
Rezultă: 
14) = 3 
o 
iar 
lu) = 
n) = 22 
Concluzia imediată este aceea că 
= 07) 


adică se respectă condiţia de egalitate din relația Rao-Cramer, deci estimatorul este 


eficient. 
Pentru extragerea fără revenire 
În acest caz, se poate demonstra că varianța mediei de selecție este: 





i 
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N-—n 
V(A) = ————— 02 
() == N 
Într-adevăr, varianța se poate calcula cu ajutorul variabilelor aleatoare 
indicator: 


VA) = EA n)? 


: 1 
V(p)=E as uz + iai a (a — H)lies,j jes 
De 


Deoarece: 
n 
E(17s) = E(lies) = pi = N 
n(n — 1) 
E(lies,jes) = Pi = NN 
iar 
N 2 N NN 
(e - 2) => up + dd — plai —u)=0 
i=1 i=1 i=1 j =4 
rezultă că 
, 02 N-n 
DĂ 
k n (N-1) 


Dacă volumul populaţiei este suficient de mare, atunci se poate aprecia că 
diferența dintre N și N — 1, din relația de mai sus, este neglijabilă și se poate 
rescrie relația astfel: 

aj ep sate 
= n N n 
unde f =n/N şi se numește fracție de sondaj sau factor de corecție pentru 
populaţii finite. Acest factor corectează varianța estimatorului mediei din cazul 





extragerii cu revenire (caz în care populaţia este considerată foarte mare sau tinde 
la infinit). 
Rezultă: 


9 


g2 
= (la 


Ș 
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Observaţie 

Între cele două tipuri de extragere se poate observa uşor că există o diferență 
de precizie care rezultă din compararea varianțelor pentru estimatorul medie. 
Această diferenţă apare datorită coeficientului (1 — f). Dacă fracția de sondaj sau 
raportul de mărime dintre eșantion și populaţie este semnificativ, atunci şi diferența 
dintre cele două varianţe este semnificativă. În acest caz, sondajul fără revenire este 
mai precis, pentru că varianţa estimatorului este mai mică. Invers, dacă fracția de 
sondaj este nesemnificativă (volumul populaţiei este foarte mare în comparaţie cu 
eşantionul sau tinde la infinit), atunci între cele două tipuri de extragere nu există o 
diferență semnificativă în materie de precizie. 


Convergentța în repartiție a mediei de selecție 

Aplicată estimatorului medie de selecţie, teorema limită centrală ne spune 
că, indiferent care este legea de repartiție a variabilei X, dacă volumul eșantionului 
este suficient de mare, atunci estimatorul standardizat urmează o lege de repartiție 
normală standard: 


d-u 
0 


Vn nEeN 


Această proprietate este esenţială pentru că oferă o lege de repartiție pentru 
estimator în condiţiile existenţei unui eşantion de volum suficient de mare. 





rep 
—— Z=N(0,1) 


Exemplu 

Pentru cele 36 de eșantioane prezentate anterior, distribuţia mediei de 
selecție este prezentată mai jos. Se observă că această distribuţie a mediilor 
eşantioanelor posibil de extras din populaţia de referință se apropie de forma 
distribuţiei normale, în ciuda faptului că volumul eșantionului este mic. 


ja 


i 


| 


Figura 2.1. Distribuţia mediei de selecție 
Sursa: Realizat de autor. Date convenţionale 


Frecvența 





media de selecție 
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2.2.2. Valoarea globală sau totalul de selecţie 


Definiţie 


Pentru o variabilă X notăm totalul prin: 


N 
= dai 
i=1 
T=N-u 


Un estimator nedeplasat pentru valoarea globală este: 
n 
î=N-p= i d X 
T= Wu = n 4 i 
i=1 


E(î)=N-E(p)=N-u=r 


unde: 


La nivel de eșantion, o estimaţie a totalului este o valoare realizată a 
estimatorului: 


Proprietăți 
Pentru acest estimator se poate determina ușor varianța pentru cele două 
tipuri de selecție. 


Cazul extragerii cu revenire 


g2 
V(î) = 07 = N2-V(A) = N2:-— 


Cazul extragerii fără revenire 
N-—n 02? a 
a — 2 = N2 N = N2 
V(î) =o07 =N*:-V(A) = NE: 
Un estimator al acestei varianţe este: 


Ar2 
o 
Sa NCN e) e 


Estimaţia la nivelul unui eşantion este de forma: 


„2 
Ss 
sg = NN n): 
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2.2.3. Moment iniţial de selecţie de ordin k 


Definiţie 
Pentru parametrul moment iniţial de ordin k se defineşte estimatorul: 


n 
Di 
izi 


unde X; sunt variabilele aleatoare de selecţie, iar k e N”. 


În = 


3l= 


Proprietăți 
Se poate demonstra că acest estimator are următoarele proprietăţi: 
— este nedeplasat: 


E(Ân) = Hk 
— are varianţa şi momentul de ordinul 2: 
A Hank — Hk 
(= 
n 
unde: 
Ha = E(X2*) 
— este convergent: 
n 
Ul k 
a d ăi ——— HU 
i=i nEN 


2.2.4. Proporția de selecţie 

Parametrul proporţie poate fi tratat ca o medie a unei variabile binare. Cu 
alte cuvinte, toate elementele prezentate pentru parametrul medie pot fi utilizate Şi 
în cazul definirii unui estimator pentru proporţie. In această logică, prezentăm 
definiţia și proprietăţile estimatorului proporția de selecție. 

Definiţie 

Se consideră variabila alternativă: 


0 1 
x: ) 
1—r 1 


1 reprezintă proporţia sau ponderea unităţilor din populaţie care îndeplinesc 
o anumită proprietate sau condiţie A, unde 0 <r < 1. 
Rezultă că: 


_M 
A 





| 
| 
| 
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unde M este numărul unităţilor din populaţie care îndeplinesc condiţia A. 
Parametrul se poate exprima ca o valoare relativă sau în procente. 
Se numește proporţie de selecţie statistica definită prin relaţia: 


îi = ăĂ:; 


3l= 


n 
i=1 
unde variabilele aleatoare de selecție X; sunt variabile aleatoare de tip Bernoulli, 
identic repartizate şi independente probabilistic, adică sunt definite prin tabloul: 


id, 
"U-n rm 


V(X) = VO) =n(1-n) 


Rezultă că: 


La nivelul unui eşantion extras după metoda sondajului aleator simplu, se 
defineşte proporţia de eșantion: 

m 

W = — 

n 


unde m reprezintă numărul unităţilor din eşantion care îndeplinesc proprietatea A. 
Această valoare reprezintă estimaţia punctuală a parametrului 7. 

Proprietăți 

Proporția de selecție este un estimator nedeplasat 


Ca şi în cazul mediei, se poate demonstra uşor că E(â) = e, adică media 
estimatorului este egal cu parametrul 7. 


Proporția de selecție este un estimator convergent 
Pentru un eșantion cu volum suficient de mare are loc: 


e p 
(fn )nen —— 7 


Primele două proprietăți asigură baza pentru estimarea punctuală a 
parametrului 7. 


Proporția de selecție este un estimator eficient 
Notăm varianţa mediei de selecție: 


V(â) = 0 


Aceasta se calculează diferențiat în funcție de tipul de extragere utilizat și 
asigură condiţia de eficienţă: 
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- în cazul extragerii aleatoare cu revenire 


VO) _n(-n) 
E e ma 


2 


T 


- în cazul extragerii aleatoare fără revenire 


ge Dap 


unde 





(4-7) = 


Convergența în repartiție 

Dacă standardizăm proporția de selecție, iar volumul eșantionului crește 
peste o anumită limită, se obţine o variabilă aleatoare care urmează o lege de 
distribuţie normală standard: 


fi —rn 
n(1 —r) 
n nEN 


rep 
——— Z=N(0,1) 


2.2.5. Varianţa de selecţie 


Definiţie 
Se numește varianţă de selecţie statistica: 


n 

= DX 1)? 

= iu 
i=1 


unde variabilele aleatoare de selecție X; sunt variabile aleatoare identic repartizate 
şi independente probabilistic. 
O altă relaţie pentru varianţa de SE este: 


n n 
1 pl 
d A + P0) = DE — 2 dh rt? 
= 


i=1 








i 
i 
i 
i 
i 
i 
i 
i 
i 
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O valoare posibilă a acestui estimator este varianţa de eșantion: 


1 n 
ge =) (a — 22 
n : 
= 


Proprietăţi 


Varianţa de selecție este un estimator deplasat pentru parametrul o? 
Se poate demonstra uşor că: 


1 | 
= cf iau-ar) =" 92 





sau 
2 
o 
E(82) = 92 —— 
n 
Rezultă că deplasarea estimatorului este 
2 
0 
B(0) = —— 
n 
Varianţa estimatorului este: 
m _0(b-o0t _glt-gt g(b—3g4 
(o a a 
n n n 
unde 


N 
1 
gb = Dă IE 
i= 


este momentul centrat de ordinul 4. 


Varianţa de selecţie modificată 
Pentru a corecta proprietatea de deplasare a varianței de selecţie, se 
construiește un alt estimator numit varianță de selecție modificată: 


n 
si 1 Ă 
GI > 0-2) 
n— 14 j 
l= 





sau 
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Se observă imediat că acest estimator este nedeplasat pentru parametrul 


varianță 02: 


E(3%) = E (82) = 


n n-l 
d =7 














"_B(62) = 
d ai 


Pentru un eșantion fixat, o valoare a statisticii este varianţa de eşantion 
modificată şi reprezintă estimaţia punctuală a varianţei 02: 


1 n 
12 zi 
s = Dl — 32 
iZ1 


2.2.6. Moment centrat de selecţie de ordin k 





Pentru parametrul moment centrat de ordinul k se defineşte estimatorul: 
N 
300 = Sa — pt 
n : 
L= 


La nivelul unui eşantion fixat, se obţine estimaţia punctuală: 


n 
1 
s(k) = => Ga ca x)K 
n 2 
i=1 


2.3. Selecţii pentru populaţii care urmează legi de distribuţie 
normale 


Considerăm o variabilă aleatoare care urmează o lege de distribuție normală 
de forma: 


X=N(u,0?) 


O selecție de volum n din populaţia de referință este dată prin vectorul 
aleator V: (X,, X2, ...., X), unde X;-N(u, 02). 

Pentru aceste selecții prezentăm o serie de rezultate mai importante care sunt 
utile în rezolvarea problemelor de inferență statistică. 


Suma variabilelor aleatoare de selecție la pătrat reprezintă o variabilă 
aleatoare care urmează o lege de repartiție Chi-pătrat 
Fără a restrânge generalitatea, considerăm X;=N (0, 02). Atunci, 


n 
p= Xe -x2(n,09) 
ZI 
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Distribuţia Chi-pătrat este dată prin funcţia densitate: 


1 i aaa 


SE edi, si >) 
fix) = 2207 (5) 
0, x < 0 


iar 
[(aj-:= | x2-le”*dx, a >0 
0 


Parametrii distribuţiei sunt n, volumul eșantionului (numărul de variabile 
sumate), care poartă numele de număr de grade de libertate, și abaterea standard o. 
Analog, dacă se consideră X;=N(u, 02), 


= SE) ran 


i=1 
2 


, 


În cazul în care se utilizează estimatorul varianţei de selecţie modificate 6' 
are loc relaţia: 


N (n) a 


Y az —x2(n — 1,1) 


Suma unor variabile aleatoare Chi-pătrat reprezintă tot o variabilă care 
urmează legea Chi-pătrat 
Fie X;-y2(k;,0), atunci 


n n 
Y = Dx, 2 (hu) 
iZ1 iZ1 


Raportul dintre o variabilă aleatoare normală şi rădăcina pătrată a unei 
variabile Chi-pătrat reprezintă o variabilă Student 
Fie X-N(0,02), Y=x2(n,0), atunci 


ă 
t = —— t(n) 
Y 


n 


Funcţia densitate a repartiției Student este: 
n+i 


poale „ER 


ar) n 
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Parametrul acestei distribuții este n, care poartă numele de număr de grade 
de libertate. 
= Ș ă, a 3 AED ș 
Dacă se consideră cazul estimatorului 6'“, cu proprietatea: 


n—] 
O ram 14) 


se obține variabila Student utilizată în procesul de estimare: 


_Azu 


3? 


n 


t 





-t(n = 1) 


Raportul a două variabile aleatoare Chi-pătrat reprezintă o variabilă 
aleatoare Fisher 
Fie două variabile U=y2(m,0), V=x2(n, 0), atunci: 


U 
za i a 
X = V F(m,n) 
n 
Pentru legea de repartiție Fisher, funcția densitate este: 
na 
(22) 2 d _Natha 
Ri n 2 
po = (aria) e x>0 
B (3.2) î 
0, xS<0 


unde 
1 
B(a,b):= ja (1 — x)b-1dx, a>0,b>0 
0 
Cei doi parametri ai repartiţiei sunt cele două grade de libertate: n și m. 


Dacă se iau în calcul două variabile aleatoare X,=N(u4, 02), X2=N(u2, 02), 
iar pentru estimatorii varianţelor se consideră: 


(n = 1) 
n 6-2(m — 41) 
1 


(n2 pază 1) Ar2 2 
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atunci 
2 ar2 
0; 6. 
Parta Pa = la = 1) 
0; 6, 


Suma sau diferența unui număr de variabile aleatoare normale reprezintă o 
variabilă aleatoare normală 
Considerăm X;=N (ui, 02) şi n constante reale a;. Are loc relaţia: 


n n n 
x= ax, a au atei) 
i=1 i 


În particular, dacă avem două variabile aleatoare X,=N(p,02), 
X>=N(u2, 02), atunci diferenţa lor urmează o lege normală de forma: 


Ă = X, — X2 Na — Ha, 02 + 02) 


În cazul variabilelor aleatoare de selecție X;=N(u, 02), are loc: 


n 
= 15% N g2 
să i Ma 





Evident, 





Pentru două eşantioane de volume n, şi n2 și două variabile X, Nu, 02), 
X=N(u2, 02), se poate considera diferenţa dintre estimatorii mediilor, știind că: 


ci 0) a să 
MW Aa) » Wa Ma 


atu dd „că 
Ma — M2 Ha Ham n 


Are loc: 


iar 
fesca e la =H2 (0,1) 
| Ha Na 





| 
| 
| 
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În situaţia în care varianţele celor două distribuții sunt egale, se obţine 
variabila: 
fn — Bz — (ua — 2) 
Z = a aie -N(0,1) 
0 Ta + na 
Dacă nu se cunosc varianţele celor două variabile, se construiește variabila 
Student: 


ai A (ro 00) (41240) 





În cazul în care cele două distribuții au o varianţă egală şi necunoscută, 
X.=N(u, 02), X2=N(u2,02), pentru diferența dintre estimatorii mediei se 
construiește variabila Student: 


nna(ha + n2 — 2) | Aa — Ba — (ua — H2) 


MĂ+n 
bit, (n, — 108:2 + (n2 — D832 





=t(n, + n2 — 2) 


2.4. Estimarea prin interval de încredere a unui parametru 


Estimarea prin interval de încredere are la bază ideea de a construi un 
interval aleator care să conţină, cu o anumită probabilitate cunoscută numită nivel 
de încredere, parametrul estimat. 

Considerăm a € (0,1), cu a aproape de zero. Notăm (1 — a) nivelul de 
încredere sau probabilitatea cu care estimăm parametrul. 

A estima prin interval de încredere un parametru 9 înseamnă a determina 
două statistici, numite limita inferioară (L;) şi limita superioară (Lg), astfel încât să 
aibă loc relaţia: 


PU, <0<L,)=(1-a) 


Observația 1 

Deoarece parametrul este o constantă şi limitele intervalului sunt variabile, 
este corect ca la interpretare să se spună că intervalul acoperă parametrul (sau că 
intervalul conţine parametrul) cu probabilitatea (1 -— a). Evident, a este 
probabilitatea ca intervalul să nu acopere sau să nu conțină parametrul. 
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Observaţia 2 

În cazul legilor de repartiție simetrice şi unimodale, intervalele de încredere 
au o lungime minimă. Această proprietate se aplică în special în cazul estimării 
mediei și a proporţiei. 


2.4.1. Estimarea mediei 


Determinarea intervalului de încredere pentru parametrul medie necesită 
cunoaşterea legii de repartiție a estimatorului. Există două situaţii: 
- dacă se cunoaște legea de repartiție a variabilei analizate, de exemplu 
X-N(u,02), media de selecție are tot o lege probabilistă cunoscută, mai 
precis este vorba despre distribuţia normală: 


A N o? 
AN |n 


- dacă nu se cunoaște legea de repartiție a variabilei X, se poate utiliza 
proprietatea de convergenţă pe care o oferă reorema limită centrală, adică: 


fu 
0 


Vn nEeN 


Aşa cum se observă din relaţiile de mai sus, legile de repartiție ale 
statisticilor depind nu numai de parametrul u, ci și de o2. Rezultă două situaţii 
pentru estimarea prin interval de încredere a mediei. 





rep 
—— Z=N(0,1) 





a. Intervalul de încredere al mediei pentru cazul 02 cunoscut 

În funcţie de tipul de extragere a eșantionului (cu sau fără revenire), avem 
iarăși două situaţii. Practic, intervalul se obţine la fel în ambele cazuri, ceea ce 
diferă fiind doar varianţa mediei de selecţie. 


Intervalul de încredere în cazul extragerii aleatoare cu revenire 
In acest caz, se utilizează statistica 


iu 
Z=— 


Vn 
pentru care se poate accepta că urmează o lege de repartiție normală standard, cel 
puţin asimptotic. 
Dacă Z=N (0,1), se utilizează funcţia densitate: 
1 
2 





z2 
-e 2, xEeR 


f(z2) = 


ŞI 





i 
j 
i 
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care are următoarea formă: 


9.4 








G , 
-3 -a -1 9 1 2 3 
Figura 2.2. Repartiția normală standard N(0,1) 


De asemenea, pentru stabilirea intervalului de încredere, se utilizează funcţia 
lui Laplace: 


so e -7 qi 


Pentru un nivel de încredere egal cu (1 — a), având o lege de distribuţie 
simetrică, intervalul de încredere este minim și se obţine din relaţia: 


P(-z <Z<2)= (1-a) 


(1-a) 





Figura 2.3. Valorile teoretice ale distribuției normale standard 
pentru un nivel de încredere de (1-a ) 


Conform legii Gauss-Laplace, probabilitatea de mai sus se poate calcula cu 
ajutorul funcției lui Laplace (vezi figura 2.3): 


pita Daia | rar = 200 =1-a 


= 
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Folosind tabela lui Laplace, se poate obţine z pe baza relaţiei: 
1-a 
2 


Pentru obţinerea intervalului de încredere, se fac câteva modificări 
elementare în relaţia de mai jos: 





P(z) = 





P(zs<2sz)=P|l-zs——sz|=l-a 


Rezultă: 


L=A E 
= — zZ— 
iii 

e 0 
Ls =A+z-—= 


iar intervalul poate fi scris astfel: 


( i - = 
HIZ-R= 

Vn 

La nivelul unui eşantion extras aleator cu revenire din populaţie, se obține un 
interval de încredere estimat sau calculat de forma: 


XI z-—= 
“An 
Observaţii 


— lungimea intervalului de încredere este: 


0 
2-z— 
Vn 
— eroare maxim admisibilă sau eroare limită pentru parametrul medie 
reprezintă mărimea intervalului de încredere: 
Și 0 
= z—= 
Hu fi 
— eroarea limită cuprinde două componente care vizează nivelul de încredere şi 
calitatea estimatorului; 
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— dacă se modifică probabilitatea (1 — a), se modifică valoarea teoretică z, 
deci se modifică lungimea intervalului. De regulă, creşterea probabilității 
conduce la o creştere a mărimii intervalului şi, prin urmare, o scădere a 
preciziei estimării; 

— abaterea standard a estimatorului se mai numeşte şi eroare standard a mediei 
(Standard Error - SE) şi este dată de relaţia: 


o 
SE =—= 
Yn 
— eroarea standard admite alte două componente care pot modifica mărimea 
intervalului de încredere: volumul eșantionului şi gradul de omogenitate a 
populației, măsurat cu abaterea standard o. Dacă volumul eșantionului 
creşte, mărimea intervalului scade, adică se înregistrează o creştere a 
preciziei estimării. Evident, eşantionul nu poate fi mărit decât până la o 
anumită limită, în general, din raţiuni de timp şi de cost. Întrebarea este dacă 
se poate micşora valoarea lui o pentru a crește gradul de precizie. Pentru 
moment, răspunsul este da (de exemplu, printr-o grupare a unităţilor 
populației pe grupe omogene), iar explicaţiile vor fi prezentate în capitolul 
dedicat sondajelor mixte; 
— intervalul de încredere se poate scrie astfel: 


(3 + z.-SE) 


Exemplu 

Într-o cercetare prin sondaj aleator simplu, extragere cu revenire, pentru un 
eşantion de n = 400 de studenți, s-a realizat un studiu privind utilizarea telefonului 
mobil. Pentru variabila (X) timp de convorbire pe zi exprimat în minute, la nivelul 
eşantionului, s-au obţinut rezultatele: timp mediu de convorbire pe student de 125 
de minute și o abatere standard de eşantion modificată de 25 de minute. Dintr-o 
cercetare anterioară, se cunoaşte că abaterea standard la nivelul întregii populaţii 
este de 50 de minute. Să se estimeze prin interval de încredere numărul mediu de 
minute consumate de un student la nivelul întregii populaţii, pentru o încredere de 
95% şi pentru situaţia de 90%. 

Intervalul de încredere se calculează cu ajutorul relaţiei: 


(i 


(4 4+z-SE) 


sau 


În relația de mai sus se cunosc: X = 125; n = 400; o = 50. 











| 
| 
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Valoarea lui z se citeşte din tabelul probabilistic al distribuţiei Laplace, 
pentru nivelul de încredere stabilit, conform relaţiei: 
1-a 
2 


In cazul unui nivel de încredere de 0,95, se citește valoarea lui z 
corespunzătoare funcției lui Laplace: 


P(z) = 





0,95 
b(2z) = ga 0,475 


Din tabel rezultă: z = 1,96. 

Intervalul de încredere pentru o probabilitate de 0,95 este: 

(125 + 1,9633), adică (125 + 1,96 . 2,5) sau (120,1; 129,9) minute. 
Mărimea intervalului de încredere este de 4,9 minute, iar eroarea standard a 


za 50 , 
mediei este SE = Ti3 = 2,5 minute. 


Interpretare 

Numărul mediu de minute la telefon utilizate de un student din populaţia de 
referință este acoperit de intervalul (120,1; 129,9) minute, cu o probabilitate de 
0,95. 

În cel de-al doilea caz, probabilitatea este mai mică și se utilizează relația: 

(2) = aa = 0,45, de unde rezultă valoarea z = 1,65. 

După calcule, rezultă intervalul de încredere: 

50 SE pi ez ÎN e de dtac 
(125 + 1,65 3) adică (125 + 4,125), deci un interval mai mic de: 
(120,875; 129,125) minute. 
Intervalul de încredere în cazul extragerii aleatoare fără revenire 
Pentru acest tip de extragere se ţine cont că varianţa mediei de selecție este: 


2 _97 
Op > e ef) 


iar intervalul se construieşte pe baza relaţiei: 


02 g? 
Plâ-z UP Ssusitz (=) = 1-a 
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2 
az a-p 


La nivelul unui eşantion posibil de extras, se obţine relaţia de calcul pentru 


intervalul estimat: 
sep [Eaef 
x+z —(-— 
a n 
Observație 


Deoarece abaterea standard a estimatorului mediei este 


(a-p 
po | edit 
n 


atunci coeficientul de variaţie al mediei de selecţie are relaţia: 





adică este de forma: 


(12) 


o 
u n 





Însă raportul o/u =vw este tocmai coeficientul de variaţie la nivelul 
populaţiei totale. Prin urmare, coeficientul de variaţie al mediei de selecție este: 


ip iasa INSEL) 
n 
Exemplu 


Considerăm datele de la exemplul anterior, o probabilitate de 0,95 și, în plus, 
se consideră o extragere fără revenire dintr-o populaţie de 10000 de studenți. 
Fracţia de sondaj este: 





__m 400 ziz0ă 
I = > 10000 * 0 


In acest caz, intervalul de încredere se calculează astfel: 


Zu dă e 52 42554:96 SO 0,04) | = (125 + 48) 
că dh PD) |= "529.1 200 î. = 


minute. 
































see 
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Observație 

Faţă de cazul extragerii cu revenire, intervalul de încredere este mai mic, 
pentru aceeași probabilitate, adică rezultatul este mai precis. Diferenţa dintre cele 
două rezultate devine nesemnificativă dacă volumul populaţiei este unul foarte 
mare. 


b. Intervalul de încredere al mediei pentru cazul 02 necunoscut 


Intervalul de încredere în cazul extragerii aleatoare cu revenire 

În cele mai multe cazuri, parametrul varianță nu este cunoscut și trebuie 
estimat. Dacă se utilizează ca estimator varianța de selecție modificată, pentru un 
eşantion suficient de mare, se obține statistica Student: 


_Â-u 


!2 


n 


t 





-t(n — 1) 


Repartiția Student este simetrică, deci se poate construi un interval de 
încredere minim pentru un nivel de încredere cunoscut (1 — a). Cu alte cuvinte, 
folosind tabela Student, se poate determina o valoare ta 2 care să respecte condiţia: 


d -—u 
= St = 1-a 
Dale 
Vn 
Tabelele probabiliste pentru repartiția Student oferă valoarea teoretică în 
baza condiţiei: 





P(-tapa St S ta/2) = P| —tap < 


P(t > tap2) == 
Rezultă imediat: 
P(a- ta ast sf ttapa pa 
Vn Vn 
adică intervalul de încredere este de forma: 
mat) 


La nivelul unui eşantion extras din populaţie, se obține relația de calcul 
pentru intervalul estimat: 


î s' 
(tura) 
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Intervalul de încredere în cazul extragerii aleatoare fără revenire 
Se utilizează relația: 







3? 


TU A)SHSâtiap 





de unde rezultă intervalul: 


A E ta/2 


x + ta/2 





Exemplu 

Considerăm datele de la exemplul precedent, fără a dispune însă de o valoare 
a abaterii standard la nivelul populaţiei totale, și se consideră un nivel de încredere 
de 0,95. Se cunoaşte însă s'2 = 25 de minute. În aceste condiţii, intervalul de 
încredere se determină pe baza abaterii standard de eșantion modificate. 

În cazul extragerii cu revenire, intervalul de încredere pentru medie se obţine 
cu relaţia: 


s! 
F1 tar 
( a/2 =) 
Valoarea teoretică se citește din tabelul Student pentru relaţia: 


P(t > ta/2) = 0,025. Rezultă o valoare ta/2 = 1,96, iar intervalul este: 


(125 + 1,96 Da), adică (125 + 4,9) minute. 


2.4.2. Estimarea valorii globale (a totalului) 


Pentru parametrul 7T=5%,x sau T=N-y se utilizează estimatorul 
nedeplasat și convergent: 





| 
| 
| 
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La nivel de eşantion, se estimează punctual totalul prin estimaţia: 


Ca şi în cazul mediei, există cele două situaţii, când se cunoaşte sau nu 
parametrul varianței. Exemplificăm doar cazul cel mai întâlnit, când varianţa este 
necunoscută. 


Intervalul de încredere în cazul extragerii aleatoare cu revenire 
(£ tuia 62) 
sau 
( ea â') 
Vn 
La nivelul unui eșantion extras, se calculează intervalul: 
Țk d, 
(72 top Sa ) 


Intervalul de încredere în cazul extragerii aleatoare fără revenire 
Se construiește intervalul de încredere: 





Exemplu 

Pentru datele de la exemplul precedent, cunoscând că volumul populaţiei 
studenților este de 10000, să se estimeze prin interval de încredere numărul total de 
minute consumate la nivelul întregii populaţii, cu o probabilitate de 0,95. 

La nivel de eşantion, intervalul de încredere este: 
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Valoarea totală la nivel de eșantion este T= N. = 10000125 = 
1250000. 

Din tabelul Student, valoarea teoretică, pentru o încredere de 95%, este 1,96. 

Rezultă intervalul: 


(1250000 + 1,96 [10000 - 9600 - =) adică (1250000 + 4800) minute. 


2.4.3. Estimarea proporțţiei 


Pentru parametrul proporţie, procedeul de estimare prin interval de încredere 
urmează paşii prezentaţi pentru cazul mediei. Pentru fiecare caz în parte, prezentăm 
în sinteză relaţiile estimatorului proporţie de selecție: 


3l= 


n 
îi = X; 
=1 


bsi 


a. Intervalul de încredere al proporţiei pentru cazul o? cunoscut 
Cazul sondajului aleator cu revenire 
Se utilizează statistica 
îi —rn 
0 


Yn 


pentru care se acceptă ipoteza că tinde spre o repartiție normală standard. 
Intervalul de încredere, pentru o probabilitate (1 — a), este: 


(2272) 


unde z se citeşte din tabela Laplace, pentru 


Z = 





1—a 


P(z) = 3 





Interval estimat corespunzător este: 


(mzz2) 


(w + z.SE) 


sau 








j 
| 
i 
i 





Sondajul aleator simplu 109 





Eroarea standard a proporţiei se mai poate scrie: 


o r(1 — 7) 
Vn n 


Observaţie 
Coat 0 patra . sai 
Mărimea A, = z= se numeşte eroare limită de estimare a proporției. 
Această limită se poate fixa a priori pentru a putea apoi calcula un volum al 
eșantionului care să asigure o estimaţie a parametrului în limitele acestei erori 
fixate. 


Cazul sondajului aleator fără revenire 
Intervalul prezentat în cazul precedent se modifică la nivelul varianţei 
estimatorului cu coeficientul de corecție (1 — f): 


îi +z tf) 


Similar, intervalul estimat la nivelul unui eșantion este: 
2 
o 
w+z DE (1 = f) 


Exemplu 

Considerăm cazul unui eşantion de 100 de studenţi extrași aleator simplu 
fără revenire dintr-o populaţie de 5000 de studenţi. Din anchetă se observă că, la 
nivel de eșantion, numărul studenţilor care deţin un smartphone este egal cu 85. Se 
cere să se estimeze prin interval de încredere procentul studenților care dețin un 
smartphone la nivelul întregii populaţii, cu o încredere de 98%, considerând că 
dintr-un studiu anterior se cunoaște o varianţă a variabilei analizate în valoare de 
0,16. 

Pentru calculul intervalului de încredere se determină mai întâi ponderea 
estimată de studenți care au un smartphone: 

85 


Weg da 


Din tabela Laplace, se citeşte o valoare pentru 


a 
b(2) = a = 0,49 
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Rezultă valoarea z = 2,33. 
Fracţia de sondaj este: 


Intervalul de încredere este: 
g2 
wăz Cl — £) |= (0,85 4 2,33 0,039) = (0,85 + 0,09) 


În procente, intervalul este: (85% + 9%) sau (76%; 94%). 
Ca interpretare, se poate aprecia că procentul real al studenților care deţin un 
smartphone este acoperit de intervalul (76%; 94%), cu o probabilitate de 0,938. 


b. Intervalul de încredere al proporției pentru cazul 92 necunoscut 


Cazul sondajului aleator cu revenire 
Determinarea intervalului de încredere presupune mai întâi identificarea 
estimatorul varianței: 


A2 __ TI >=) 





O. = 
F n 
Statistica utilizată în acest caz este: 
fi —rn 
t=— 
On 
Yn 


pentru care se acceptă că tinde spre o repartiție Student de n — 1 grade de libertate. 
Intervalul de încredere, pentru o probabilitate (1 — a), este: 


sau 





Valoarea teoretică din tabelul Student se obține pentru: 


a 
PE > tan) =3 


Interval estimat se obține pe baza estimaţiei punctuale a proporție w: 
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Sr 
( + taya 2) 


sau 


w(1 —w) 
w4it SC — 

a/2 n 
Eroarea standard estimată a parametrului proporţie este de forma: 


w(1 —w) 
n 


SE = 


Cazul sondajului aleator fără revenire 
Intervalul probabilist are relația: 


ȘI 3 
i + ta/2 E (=) 


iar intervalul la nivel de eșantion este: 





Exemplu 

Pentru datele din exemplul anterior, se consideră doar rezultatele de la 
nivelul eșantionului pentru estimarea proporţiei prin interval de încredere. 

În acest caz, se utilizează relația: 





Din calcule, rezultă intervalul: 
(0,85 + 2,33 : 0,034) sau (0,85 + 0,079). 


2.4.3. Estimarea varianţei 


| Analizăm această problemă doar în cazul sondajului aleator simplu cu 
| revenire. Pentru o variabilă care urmează legea normală, repartiția admite doi 
| parametri: media și varianţa. Determinarea intervalului de încredere al varianţei 
presupune două situații: se cunoaște sau nu parametrul medie. 





i 
ş 
i 
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a. Intervalul de încredere al varianţei pentru cazul „i cunoscut 
În condiţiile în care considerăm că variabila X urmează o lege normală, se 
utilizează o statistică de forma: 


izi 


Pentru un nivel de încredere (1 — a) fixat se utilizează repartiția Chi-pătrat 
pentru a determina două mărimi h4 și h> pentru care are loc: 


P(h, <H<h=(U-a) 


Aceste valori se citesc din tabela Chi-pătrat pe baza condiţiilor: 
a 
P(H > h) = 1-— Z 


a 
2 
Intervalul de încredere se obține pe baza relației: 


p(n 670) sta] a-o 


i 
Rezultă: 


n CX — u)2 n (AX, — u)2 
p (Sai ape a iza =p H) ) = (1-a) 
2 1 


Intervalul de încredere calculat la nivelul unui eșantion este de forma: 
ha i ha 


b. Intervalul de încredere al varianţei pentru cazul Hu necunoscut 
Dacă parametrul medie nu este cunoscut, se utilizează o altă statistică: 


(n 1) 25 
—— 6 


H = 275 -x2(n 33 1,1) 


Similar cu cazul anterior, intervalul de încredere se bazează pe proprietatea: 


P(h, <H<h2)=(1-a) 
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iar valorile teoretice se obțin pe baza tabelelor probabiliste pentru: 
a 
P(H > h.,)=1— 3 


a 


Intervalul de încredere probabilist este următorul: 


(n = 167 (n- 16? 
ha : ha ) 


iar cel estimat la nivel de eșantion este: 


(n — 1)s'2 | (n — 1)s'2 
( haha 


2,5. Calculul volumului eșantionului 


Sondajele aleatoare simple impun o condiţie foarte importantă, anume 
cunoașterea volumului eșantionului. Cele mai multe cercetări prin sondaj încep cu 
această întrebare: cât de mare trebuie să fie eşantionul? Am precizat deja că 
eşantioanele aleatoare impun o condiţie de volum, adică sunt eşantioane mari. De 
asemenea, am arătat că precizia estimaţiilor obţinute poate fi ridicată dacă se crește 
volumul eşantionului. 

În funcţie de situaţiile existente în practică, putem sublinia două posibilități 
privind calculul volumului eşantionului: dacă există condiţii de costuri impuse și 
dacă există limite privind erorile cu care sunt obținute rezultatele. 

Aşadar, prima situaţie se referă la existența unor restricții de cost impuse a 
priori. În acest caz, se împarte suma totală disponibilă (costul total - cp) la costul 
unitar (c,,) pe chestionar și se obține mărimea eşantionului: 


Cr 
ia 
Cu 

Pentru a calcula volumul eșantionului este necesar să se cunoască informaţia 
privitoare la costul unitar. De regulă, această informaţie provine din studii 
anterioare sau se poate estima prin apelul la rezultatele din anchete similare. 

A doua situaţie este legată de utilizarea unei condiţii privind precizia 
rezultatelor. Asemenea limite de precizie se pot stabili prin utilizarea mai multor 
măsuri cu privire la erorile de eșantionare: varianța estimatorului, mărimea 
intervalului de încredere, eroarea maxim admisibilă. 

Cel mai frecvent utilizată este metoda care permite calculul unui anumit 
volum al eșantionului care să corespundă unei erori de estimare asumate și a unei 
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probabilități fixate a priori. Se stabilește o anumită limită sau o valoare a erorii 
maxim admisibile pentru un parametru care se doreşte a fi estimat cu ajutorul 
sondajului şi se fixează şi probabilitatea cu care este estimat acel parametru. 

Vom arăta în continuare cum se realizează acest calcul în funcţie de variabila 
de interes utilizată şi de parametrul luat în considerare. Ne referim la două situaţii: 
pentru o variabilă binară şi parametrul proporție; pentru o variabilă numerică şi 
parametrul medie. 


2.5.1. Cazul unei variabile alternative 


Considerăm o variabilă binară: 


x: 0 ” 
Ur n 


Obiectivul sondajului este acela de a estima parametrul 7r în condiţii de 
calitate fixate a priori. 

Deoarece măsurile cu privire la erori (varianţa estimatorului, eroarea maxim 
admisibilă sau eroarea limită) depind de tipul de extragere, calculul se realizează 
distinct pentru sondajul aleator cu revenire și cel fără revenire. 


a. Sondajul aleator cu revenire 
In acest caz, eroarea maxim admisibilă pentru proporţie este de forma: 


PO 0 
m > Z n 

A, este fixat în funcție de natura variabilei (de exemplu, pentru anchetele de 
opinie, specialiştii fixează eroarea limită undeva între 1% și 2%). 

Rămâne să se stabilească ipotezele pentru necunoscutele z şi o. 

Valoarea lui z se citește din tabela Laplace pentru nivelul de încredere 
(1 — a) fixat de cercetător. De exemplu, pentru o probabilitate de 0,95 se obţine 
z = 1,96. 

Parametrul o este, de regulă, necunoscut. Pentru acest parametru se poate 
utiliza o valoare dintr-o cercetare anterioară (acceptând ipoteza că la nivelul 
populaţiei studiate nu au avut loc schimbări structurale semnificative). O altă 
ipoteză frecvent utilizată în cercetare este aceea de a considera valoarea maximă 
pentru varianţă, ceea ce corespunde situaţiei de maximă eterogenitate a populaţiei 
sau situaţiei celei mai nefavorabile. Pentru o variabilă binară, varianța este maximă 
dacă se acceptă ipoteza că parametrul proporţie ia valoarea 0,5. 

Rezultă că 02 = 0,25. 

Având aceste condiţii, se poate calcula volumul eșantionului pe baza relaţiei: 














| 


ţ 
| 
i 
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22 


0 
2 
Aa 





N = 


Exemplu 

Dacă se consideră o eroare maxim admisibilă de 2%, o probabilitate de 0,95 
şi o varianță maximă, atunci volumul eșantionului care estimează proporţia 
populaţiei în aceste condiţii date este: 


___1,962-0,25 


—— = 2401 unităţi. 
0,02 i 


Dacă se măreşte eroarea maxim admisibilă la 3%, ne așteptăm ca volumul 
eşantionului să scadă: 


__ 1,962.0,25 


— = 1067 de unităţi. 
0,03 


În egală măsură, dacă se modifică varianţa la nivelul populaţiei, în sensul 
micșorării ei sub valoarea maximă (0,25), se micșorează volumul eşantionului. De 
exemplu, la o varianță de 0,16 și la o eroare maxim admisibilă de 2%, volumul 
eşantionului devine: 


__1,962.0,16 


— = 1537 de unităţi. 
0,02 


Calculul volumului eşantionului se poate realiza și prin stabilirea unei limite 
cu privire la varianţa estimatorului parametrului proporţie. De exemplu, dacă 
nivelul varianţei nu trebuie să depășească o anumită limită F, atunci volumul 
eşantionului se poate obține astfel: 


o 
V(â) = —s< F 
(3) e 
Rezultă: 
2 
— = 7 
n 
de unde 
d: 


b. Sondajul aleator fără revenire 
Faţă de cazul anterior, calculul se schimbă pentru că se ţine cont de mărimea 
populaţiei. Eroarea maxim admisibilă este dată prin relaţia: 


RY, 
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sau 
z202N 
NE TNZ papă 
NA + zîo 


Dacă notăm cu 











zage 
N = 
0 A2 
volumul eșantionului din cazul extragerii cu revenire se poate scrie: 
2202 gi 1 1 
N DR DR 2 
n2 4 2-07 o? „Ar SI AZ. 1,1 
ZE N Noi z2 N o z2g2 N no 
sau 
no 
N 
n 
1 + =0 
+ 


Dacă N —— oo este clar căn = no. 

Se poate observa că, în cazul sondajului aleator fără revenire, volumul 
eşantionului este mai redus decât în cazul sondajului cu revenire. Relaţia de calul 
de mai sus este valabilă și dacă se consideră o condiţie pentru varianţa 
estimatorului, doar că se foloseşte relația de bază: 


g2 


pp 

















ţ 
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Exemplu 

Pentru o eroare limită de 2% şi o populaţie de 10 milioane de unităţi se 
obţine un eşantion: n = 2400 de unități. Dacă se ia în calcul exemplul anterior, se 
observă că, pentru un volum al populaţiei foarte mare, diferența dintre cele două 
tipuri de extragere, cu sau fără revenire, devine nesemnificativă, adică volumul 
eșantioanelor obținute prin cele două metode este aproximativ acelaşi. 

În schimb, dacă populaţia are un volum mai redus, situația se schimbă. Să 
considerăm, spre exemplu, că pentru o populaţie de 100 de mii de unităţi se obține 
un eşantion de 2345 de unități, evident, mai redus decât în cazul sondajului aleator 
cu revenire. 


2.5.2. Cazul unei variabile numerice continue 


Se consideră că variabila de interes este o variabilă numerică continuă care 
la nivelul populaţiei urmează aproximativ o lege normală: X=N (pu, 02). Parametrul 
de interes este reprezentat de media populaţiei, iar asupra varianței se adoptă o 
anumită ipoteză. 

Pentru calculul volumului eşantionului care să estimeze parametrul medie în 
anumite condiţii de eroare și de probabilitate fixate, se utilizează aceleași relaţii 
prezentate anterior pentru cazul proporţiei. Singura diferență în acest caz este 
legată de obţinerea unei informaţii cu privire la omogenitatea populaţiei sau o 
valoare pentru parametrul o. 

Opţiunea cea mai bună este să se folosească o informaţie din studii 
anterioare sau să se realizeze o investigație mai restrânsă care să permită evaluarea 
nivelului acestui parametru. 

Așadar, pentru cazul unui eşantion extras aleator simplu cu revenire, 
volumul eșantionului se calculează astfel: 


272 


ZO 


Aj 





N = 


unde o? = V(X), iar A, este eroarea maxim admisibilă pentru parametrul medie. 
Această eroare se stabileşte cunoscând detaliile fenomenului analizat și reprezintă o 
fracțiune din abaterea standard. 

Mult mai simplu pentru interpretare este să se ia în calcul o eroare standard 
pentru medie acceptabilă, în condiţii de probabilitate asumate. În acest caz, se 
poate înlocui în relaţia de mai sus: 


A, = z- SE 


Pentru o populaţie de volum redus, caz în care se aplică extragerea fără 
revenire, volumul eşantionului se calculează după relaţia: 
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ZIg2 
N = 
z2g2 
A+ N 
sau 
ea 1 _ d no 
en Ace AL sie 
FI 22 No N 
unde 
Zig? 
Hg = 
A; 
Exemplu 


Considerăm cazul anchetei în care se studiază variabila (X) timp de 
convorbire pe zi, exprimat în minute, realizat de un student dintr-o populaţie de 
10000 de persoane, cunoscând că varianţa variabilei analizate este egală cu 2500. 
Se cere să se estimeze volumul eșantionului care trebuie extras aleator fără 
revenire, dacă se doreşte să se estimeze timpul mediu de minute de convorbiri pe zi 
cu o eroare standard care nu depășește 1,2 minute pe student, cu o probabilitate de 
0,95. 

Utilizăm relaţiile: 


_ 1 
CE SE 
N no 
pag: pă 
no = 37 = se 


Rezultă că ng = 2083 de studenți, iar n = 1724 de studenți. 


2.6. Exerciţii 


1. Se consideră un set de date pentru o variabilă X: (2, 4, 5, 2, 3,4), la nivelul 
unei colectivităţi de volum N = 6. 
Utilizând schema extragerii aleatoare fără revenire, să se extragă toate 
eşantioanele de volum n = 3. Se cere: 
— să se determine numărul de eșantioane posibil de extras; 
— să se construiască distribuţia fiecărui eşantion extras; 
— să se calculeze probabilitatea de a extrage un eşantion; 
— să se calculeze probabilitatea de includere a unei unităţi în eşantion; 





i 
i 
| 


| 
| 
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— să ce construiască distribuţia mediei de selecţie și să se verifice proprietatea 
de nedeplasare; 

— să se reprezinte grafic distribuția mediilor de eșantion şi să se interpreteze 
rezultatul obținut. 


2. Pentru un eşantion de 15 studenţi, extraşi aleator fără revenire dintr-o 
populație de 100 de studenţi, s-au înregistrat următoarele valori pentru timpul de 
rezolvare a unui test, exprimat în minute: (45, 50, 46, 40, 38, 42, 40, 45, 50, 44, 2, 
48, 41, 42, 46). Se cere: 

— să se estimeze punctual media și varianţa variabilei pentru populaţia din care 
s-a extras eşantionul; 

— să se estimeze prin interval de încredere media populaţiei, cu o încredere de 
95%; 

— dacă se cunoaşte dintr-un studiu anterior abaterea standard a variabilei 
analizate la nivelul întregii populaţii, având o valoare de 5 minute, să se 
estimeze prin interval de încredere media populației totale folosind această 
informație și să se compare cu rezultatul obținut la punctul anterior. 


3. Un eşantion de 25 de parcări de mașini este extras aleator fără revenire 
dintr-o populaţie de 4000 de parcări ce aparțin unei regiuni geografice. La nivelul 
eşantionului s-a estimat un număr mediu de mașini parcate zilnic egal cu 120 şi o 
abatere standard de 10 mașini. Se cere: 

— să se estimeze punctual și prin interval de încredere numărul mediu de 
maşini parcate la nivelul întregii populații; 
— să se estimeze punctual şi prin interval de încredere numărul total de maşini 

parcate zilnic la nivelul populaţiei totale, pentru o probabilitate de 0,95; 

— să se estimeze prin interval de încredere varianţa numărului de maşini din 

parcări la nivelul întregii populaţii, pentru o încredere de 95%. 


4. Un studiu al opiniei politice pe un eşantion de 1000 de persoane arată că 
56% dintre cei intervievaţi sunt de acord cu schimbarea constituției. Să se estimeze 
prin interval de încredere, cu o probabilitate de 0,97, procentul de persoane, la 
nivelul populaţiei totale, care sunt de acord cu schimbarea. 


5. În vederea realizării unui studiu de opinie la nivelul studenților privind 
renunțarea la locurile cu taxă, se cere să se estimeze volumul eșantionului care 
trebuie extras din populație pentru a estima ponderea studenţilor care doresc 
această schimbare la nivel universitar cu o eroare maxim admisibilă de 1,7%. Pe 
acest subiect, pentru populaţia studenţilor nu există informaţii suplimentare, iar 
probabilitatea cu care se garantează rezultatele este de 97%. 


6. Pentru datele de la problema S$ există aceeași cerință, dar se cunoaşte 
volumul populaţiei studenților N = 9000. Comparaţi rezultatul cu cel obţinut la 
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exerciţiul 4. Dacă, în plus, se cunoaște o varianță a populaţiei egală cu 0,2, ce se 
întâmplă cu volumul eşantionului faţă de celelalte două cazuri? 


7. Într-o anchetă se doreşte să se estimeze suma medie cheltuită de un 
student pentru activităţi culturale într-o lună. Se cere să se calculeze volumul 
eșantionului necesar unui sondaj aleator fără revenire dintr-o populaţie de 4000 de 
studenţi, cunoscând că abaterea standard la nivelul populaţiei pentru variabila 
analizată este de 25 de lei şi că se doreşte ca estimarea să se realizeze cu o eroare 
standard de maxim 5 lei. 


8. Considerând aceleași condiţii de la exerciţiul precedent, se cere să se 
estimeze volumul eşantionului ştiind că varianţa estimatorului mediei nu trebuie să 
depăşească o valoare egală cu 2. 


9. S-a construit un sondaj aleator simplu fără revenire pentru care se 
cunoaşte fracția de sondaj f. Pentru care dintre următoarele elemente de calcul este 
necesar să se utilizeze valoarea lui f? 
estimarea punctuală a mediei populaţiei totale; 

— testarea diferenţei dintre valoarea mediei populaţiei şi o valoare critică 
cunoscută; 

— estimarea prin interval de încredere a proporţiei; 

— calculul erorii maxim admisibile pentru media populaţiei. 


10. În estimarea calculului volumului eșantionului, se poate utiliza o condiție 
cu privire la mărimea intervalului de încredere pentru parametrul medie. În 
condiţiile în care se cunoaște o asemenea limită și se dispune despre o informaţie 
cu privire la gradul de omogenitate al populaţiei, se cere să se stabilească o relație 
de calcul pentru volumul eșantionului în cazul sondajului aleator simplu fără 
revenire. 

11. Similar cu exerciţiul precedent, se dispune de o informaţie privind o 
limită a coeficientului de variaţie al estimatorului parametrului medie și se cere să 
se obţină o relaţie de calcul pentru volumul eșantionului în cazul unui sondaj 
aleator cu și fără revenire, cunoscând dintr-un studiu anterior coeficientul de 
variaţie la nivelul populaţiei totale. 


12. Într-o cercetare prin sondaj se dorește să se estimeze numărul de cărți 
citite de o persoană în ultimele 6 luni. Ancheta se referă la persoanele cu vârsta de 
peste 14 ani dintr-o anumită localitate. Se consideră că iniţiatorul anchetei este 
primăria respectivei localităţi şi că aceasta dispune de o listă cu adresele tuturor 
gospodăriilor ce poate fi utilizată în procesul de selecţie a unui eșantion aleator. Se 
cere: 














E 
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— să se definească populaţia de referință supusă cercetării și unităţile statistice 
individuale precizând distincţia între unităţile de eşantionare și cele de 
observare; 

— să se definească baza de sondaj şi ce elemente trebuie să conţină pentru a 
permite selecţia; 

— să se specifice ce procedeu de selecţie aleatoare se poate aplica în acest caz; 

— să se discute principalele probleme legate de construirea eşantionului. 


13. Prezentaţi câteva dintre avantajele și limitele sondajului aleator simplu. 


14. Daţi câteva exemple de situaţii în care nu se poate aplica metoda 
sondajului aleator pentru investigarea unui fenomen real. 


15. Într-o localitate există 5000 de gospodării. S-a extras aleator fără 
revenire un eșantion de 100 de unităţi şi s-a observat că doar 25 de gospodării deţin 
un autovehicul. Se cere să se estimeze punctual şi prin interval de încredere 
numărul de gospodării care deţin un autovehicul la nivelul întregii localităţi. 


16. Discutaţi posibilitatea realizării unor anchete în care se poate aplica 
metoda sondajului aleator simplu, iar eșantionul să fie extras după procedeul 
selecţiei cu revenire. 








Capitolul 3 


SONDAJUL NON-ALEATOR (EMPIRIC) 


Cercetările prin sondaj sunt condiţionate de cost, timp şi resurse umane. De 
asemenea, decizia pentru un anumit tip de sondaj poate avea rațiuni teoretice și 
metodologice sau cauze practice. În studiile cantitative, miza o reprezintă 
extrapolarea rezultatelor obţinute la nivel de eşantion pentru populaţia de referință. 
Ca urmare, condiţia de reprezentativitate este esenţială, iar sondajul aleator 
reprezintă cea mai bună soluţie. Decizia de a apela la un sondaj empiric se ia la 
limită, dacă nu există alte soluţii. Chiar dacă nu au la bază un principiu de selecție 
matematic, pentru sondajele empirice se asigură un nivel de reprezentativitate prin 
utilizarea unor principii de selecție ce respectă demersul unei cercetări ştiinţifice. În 
cazul studiilor calitative, de regulă, obiectivul principal nu este reprezentat de 
generalizarea rezultatelor la nivelul populaţiei. Asemenea cercetări utilizează cu 
succes sondajele empirice pentru că servesc scopului principal al unei cercetări în 
profunzime, pe un eșantion de unităţi extras dintr-o populaţie pe baza unor criterii 
bine întemeiate teoretic. Nu în ultimul rând, sondajele non-aleatoare sunt utilizate 
cu succes în studii cu obiectiv explorator, în etapele preliminare ale unor cercetări 
cantitative de amploare sau în studii pilot care pregătesc cercetări exhaustive cum 
ar fi recensămintele. 

Una dintre condiţiile de bază cerute de sondajele aleatoare este aceea de a 
dispune de o bază de sondaj. Deseori, în practică, o asemenea listă cu toate unităţile 
populaţiei este dificil de obţinut sau chiar imposibil de constituit. În asemenea 
situaţii, realizarea unei anchete prin sondaj presupune apelul la o serie de criterii de 
selecție care se bazează pe informaţia disponibilă și utilizează principii de selecţie 
empirice. 

În acest capitol sunt prezentate câteva aspecte specifice tehnicilor de sondaj 
care au la bază principii de selecție non-aleatoare. Capitolul se deschide cu câteva 
observaţii asupra principiilor de selecție în cazul sondajelor empirice. Urmează 
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prezentarea metodelor cel mai frecvent utilizate în practică. Ne oprim în special la 
sondajul pe cote şi sondajul pe baza unităților tip. În ultima secțiune sunt amintite 
și alte metode care se utilizează în condiţii specifice. 

Sondajele non-aleatoare permit construirea unor eşantioane ce respectă 
condiţia de reprezentativitate fără apelul la metode matematice de selecţie. 
Asemenea situaţii apar în practica sondajelor din mai multe rațiuni. Prima, şi cea 
mai des invocată, este lipsa unei baze de sondaj, condiţie expres cerută de 
sondajele aleatoare. Există însă şi alte motive pentru apelul la metode non- 
aleatoare. Uneori, interesul practic al sondajului nu este legat de realizarea de 
inferenţe statistice, ci doar de a realiza o cunoaștere preliminară a unei probleme, 
astfel că apelul la metodele probabiliste nu mai este justificat. Studiile pilot care 
pregătesc alte cercetări complexe se pot realiza cu succes prin apelul la metode de 
sondaj non-aleatoare. O altă situaţie des întâlnită este legată de costul anchetei. 
Sondajul non-aleator implică costuri mult mai mici şi chiar un timp de realizare 
mult redus. Când costul şi timpul sunt determinante, sondajul non-aleator 
reprezintă o soluție convenabilă. 


3.1. Principiile selecţiei non-aleatoare 


Sondajele non-aleatoare şi-au câștigat locul în rândul metodelor de cercetare 
parțială, în ciuda limitelor privind posibilităţile de a evalua erorile de 
reprezentativitate şi de a extrapola rezultatele obținute. În cazul sondajelor non- 
aleatoare, selecția unităților care compun eşantionul nu se realizează fără apelul la 
un principiu sau un raționament care să asigure proprietatea de reprezentativitate. 
Asemenea principii de selecție s-au constituit în funcţie de natura populaţiei, tema 
de cercetare, informaţiile disponibile, scopul cercetării etc. 

Probabil că cel mai cunoscut principiu de selecţie este cel al respectării unei 
structuri a populației totale la nivelul eşantionului pe baza unor caracteristici 
determinate în raport cu tema de cercetare şi natura populaţiei. Ideea este de a 
construi un eșantion care să reprezinte o miniatură a populaţiei, asigurând astfel 
condiţia de reprezentativitate printr-o concordanță de structură. O asemenea 
abordare presupune cunoaşterea structurii populației după anumite criterii 
semnificativ corelate cu tema de cercetare și posibilitatea selecției unui eșantion 
care să respecte această structură. Chiar dacă asemenea informaţii există, pentru a 
asigura un eșantion reprezentativ, este important să se stabilească precis care sunt 
cele mai potrivite variabile şi care este numărul optim de criterii care să asigure 
procesul de selecţie. 

Un principiu des întâlnit este cel al accesibilității unităților din populaţie. În 
eşantion sunt incluse unităţile care sunt accesibile atât prin posibilitatea efectivă de 
a răspunde anchetei, cât și prin proximitatea spaţială, prin ușurința cu care pot fi 
incluse în eșantion. În cazul unei anchete în care sunt intervievate persoane fizice, 
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criteriul accesibilității presupune includerea în eşantion a persoanelor care doresc 
să participe la anchetă, care răspund pozitiv unei asemenea invitaţii, fără a aplica 
alte criterii în plus. Subiecţii sunt aleși pentru că sunt disponibili, pentru că sunt 
ușor de selectat în eşantion. Acest criteriu se poate aplica populațiilor relativ 
omogene, caz în care reprezentativitatea nu cere o structurare a priori a populaţiei 
analizate. 

Un alt criteriu de selecție este legat de rimp. Eşantionul se poate constitui 
prin selecția unităţilor din populaţie care pot fi identificate la un moment dat sau 
într-un anumit interval de timp. Procedeul se repetă de câteva ori până la 
constituirea întregului eșantion. Rațiunea unei asemenea proceduri este dată de 
dinamica populaţiei, iar secvenţierea în timp a procesului de selecție ar asigura un 
eşantion care să respecte condiţia de reprezentativitate. Prin realizarea selecţiei la 
intervale de timp bine specificate, se consideră că procedeul asigură accesul la 
întreaga diversitate a populaţiei. 

Un criteriu similar de selecție poate fi legat de spațiu. Acoperirea spaţiului 
pe care se manifestă populaţia de referință, după un anumit criteriu geografic clar, 
reprezintă o altă posibilitate de selecţie. În general, se realizează un traseu și puncte 
de selecție care acoperă spațial populaţia şi se asigură astfel o corespondenţă între 
eşantion și întreg. 

Cele două criterii prezentate anterior, cel temporal și cel spaţial, pot fi 
utilizate împreună în procesul de construire a unui eşantion reprezentativ în 
contextul unui sondaj empiric. Abordarea beneficiază de avantajele selecţiei după 
ambele coordonate. 

O altă modalitate de a construi eșantionul este reprezentată de expertiza sau 
judecata de valoare pe care o oferă specialistul care realizează ancheta. Autoritatea 
epistemică poate funcţiona ca un criteriu de selecţie și se manifestă, în general, prin 
definirea unui profil al candidatului care urmează să fie selectat. În acest caz, 
expertul poate decide să selecteze din populaţie anumite unități, cum ar fi cazurile 
tipice, extreme, critice, particulare, comune etc. Decizia pentru o anumită categorie 
sau pentru un anumit profil al unităţilor selectate poate depinde de natura populaţiei 
studiate sau a temei de cercetare. 

Principiul bu/gărelui de zăpadă reprezintă un alt exemplu de raţionament 
după care se construiește eşantionul. În acest caz, identificarea persoanelor incluse 
în eșantion se realizează cu ajutorul celor selectate deja. Posibilii noi candidaţi sunt 
propuşi de cei intervievaţi în măsura în care persoanele deja selectate pot cu 
ușurință face o evaluare a condițiilor impuse de anchetă şi pot identifica asemenea 
unități. Acest principiu admite și riscul unor erori sistematice care însoțesc practica 
propunerii de noi unități de către cele ce au participat deja la anchetă. De exemplu, 
persoanele deja intervievate pot recomanda unităţi cu caracteristici similare. 
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Nu în ultimul rând, un procedeu de selecţie este acela care lasă decizia de a 
participa sau nu la anchetă respondentului sau unităţii individuale care primesc 
invitația de a fi incluse în eșantion. Această idee are la bază voluntarismul şi 
disponibilitatea unităţilor din populaţie de a se implica activ într-o cercetare pe 
bază de sondaj. În acest sens, pentru a sublinia importanța participării la anchetă, 
este semnificativă modalitatea prin care posibilii respondenţi sunt invitaţi să 
răspundă sondajului, precum și metodele și instrumentele care promovează 
cercetarea și pot convinge potenţialii participanţi să se implice. 


3.2. Sondajul pe cote 


Cea mai cunoscută şi poate cel mai des utilizată metodă de sondaj non- 
aleator poartă numele de sondaj pe cote (Ardilly, 1994, p. 154). Argumentele în 
favoarea acestei poziţii sunt legate în special de calitatea rezultatelor. Deşi nu se 
poate estima sau măsura precizia rezultatelor obținute, sondajele pe cote oferă 
rezultate apropiate calitativ de sondajele care implică selecţia aleatoare într-o 
anumită etapă a procesului de extragere a eșantionului (sondajele mixte). Metoda 
este frecvent utilizată în studiile economice și sociale datorită facilităţii cu care se 
obține eșantionul, a costurilor reduse și a calităţii rezultatelor. 

În cele ce urmează, se prezintă detaliat principiul de selecţie, planul de 
sondaj, o serie de probleme organizatorice, avantajele şi limitele metodei de sondaj 
pe cote. 


3.2.1. Principiul de bază. Planul de sondaj 


Metoda sondajului pe cote presupune obţinerea unui eşantion ca o miniatură 
a populaţiei după o structură dată de anumite variabile esenţiale pentru anchetă, 
numite variabile de control. La baza metodei stă ipoteza de corelare semnificativă 
a variabilelor de structurare a populaţiei cu tema sau variabila supusă cercetării în 
respectiva anchetă. Dacă se respectă această condiţie, eșantionul extras este 
considerat reprezentativ şi oferă rezultate de o bună calitate. 

Un plan de sondaj pe cote trebuie construit după aceleași reguli 
metodologice specifice oricărui sondaj statistic. Mai precis, trebuie rezolvate 
următoarele probleme specifice: 

— definirea populaţiei - caracteristica ce defineşte natura populației, spaţiul şi 
timpul; 

— definirea informaţiilor suplimentare - în acest caz, este vorba despre 
variabilele de control; 

— definirea eşantionului - volumul şi structura acestuia, metoda de selecţie a 
unităților din populaţie; 

— stabilirea gradului de precizie și a erorilor de eșantionare. 
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În această secțiune, pentru sondajul pe cote ne oprim la variabilele de 
control, definirea eșantionului, erorile de eșantionare şi precizia metodei. 


a. Alegerea variabilelor de control 

Calitatea sondajului pe cote depinde de alegerea variabilelor de control. În 
această poziţie, se pot afla variabilele care: 

— au o distribuţie cunoscută la nivelul populaţiei totale - restricţie destul de 
importantă, care poate crea probleme practice. Frecvent, pentru anumite 
variabile, se obţin informaţii din surse de date oficiale, cum ar fi 
recensământul populaţiei sau estimaţii pornind de la aceste date. Există însă 
variabile de control importante pentru care asemenea date nu sunt 
disponibile. De asemenea, uneori, informaţia privind variabilele de control 
nu este actuală şi generează erori de reprezentativitate; 

— sunt puternic corelate cu variabilele studiate în anchetă - condiţie 
indispensabilă asigurării calităţii rezultatelor; 

— pot fi uşor observate de operatori în faza de culegere a datelor - operatorii au 
anumite consemne după care identifică persoanele care fac parte din 
eşantion. Dacă acest proces nu se poate realiza uşor, pot apărea erori de 
observare importante; 

— permit corectarea erorilor care pot apărea din cauză că anumite categorii de 
persoane sunt mai uşor accesibile şi de recunoscut decât altele (Ghiglione şi 
Matalon, 1985, p. 39). 

În faza de elaborare a planului de sondaj, se propune o listă de variabile de 
control care respectă criteriile precizate mai sus. Utilizând experiența anchetelor 
anterioare, se pot construi ușor aceste liste cu variabile. De asemenea, se verifică 
disponibilitatea datelor privind structura populaţiei pentru aceste variabile propuse 
pentru a îndeplini rolul de variabile de control. 

În anchetele socio-economice, rolul acestor variabile îl iau caracteristicile 
socio-demografice ale persoanelor anchetate: vârsta, genul, starea civilă, nivelul de 
educaţie, mediul de proveniență, profesia etc. Asemenea informaţii pentru o 
populaţie există, de regulă, în registrele şi statisticile oficiale şi permit structurarea 
populaţiei şi calculul cotelor. 


b. Stabilirea cotelor şi construirea eşantionului 

Cotele sunt proporţii din populaţie, stabilite pe baza variabilelor de control 
prin valorile sau variantele sale. De exemplu, după variabila genul persoanei, într-o 
populaţie pot exista 52% femei şi 48% bărbaţi. Cele două procente reprezintă cote, 
ponderi care vor fi respectate şi la nivelul eşantionului. Un plan de sondaj eficient 
cere o extragere a eşantionului după un număr echilibrat de variabile de control: nu 
prea mare, pentru că ridică atât costurile, cât și nivelul de dificultate al selecției 
unităților; nu prea mic, pentru că reduce reprezentativitatea eşantionului şi precizia. 
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Cotele pot fi utilizate fie independent, după fiecare variabilă, fie încrucişat. 
Cotele încrucişate ridică probleme atât prin constrângerile date de existența 
informaţiilor pentru determinarea acestora, cât şi legate de extragerea eşantionului. 
Uneori, pentru un operator, a identifica o persoană după cote încrucişate este 
aproape imposibil, iar timpul de realizare a observării creşte considerabil, riscul de 
a apărea erori fiind mult mai mare. În practică, se recomandă încrucişarea cotelor 
doar dacă este cu adevărat necesară. Procedura se realizează după două variabile de 
control mai importante, iar pentru celelalte variabile se stabilesc cote marginale. 

O problemă importantă pe care o ridică construirea eșantionului într-un 
sondaj pe cote este volumul acestuia. Fiind un sondaj empiric, nu există o bază 
teoretică şi metodologică de calcul al volumului eşantionului. Soluţia este la 
aprecierea specialistului: fie să se utilizeze un volum de eşantion dintr-o metodă cu 
care acest tip de sondaj se poate compara, fie să se aprecieze în funcție de mărimea 
şi omogenitatea populaţiei. În practică, se utilizează frecvent un volum al 
eşantionului în jur de 900-1000 de unităţi (sau un volum apropiat de sondajul 
aleator simplu). Decizia asupra volumului eșantionului îi revine expertului 
responsabil cu realizarea planului de sondaj şi aceasta poate depinde de o serie de 
informaţii care provin din studii anterioare sau care vizează natura şi omogenitatea 
populaţiei. 

Extragerea unităţilor din eșantion presupune mai întâi constituirea unei 
structuri la nivelul eșantionului, utilizând cotele de la nivelul populaţiei totale. 
Dacă se utilizează un eşantion de 1000 de unităţi, atunci structura eșantionului este 
facil de obținut pe baza ponderilor de la nivelul populaţiei totale. 

Exemplu 

La nivelul României, pe lângă variabilele vârstă și gen, o structurare facilă a 


populaţiei se poate face după următoarele criterii: regiunea de dezvoltare, judeţ, 
regiunea istorică, mediul de proveniență. 


Tabelul 3.1. Structura populației României pe regiuni la recensământul din 2011 

















Regiunea Persoane | Cote 
Nord-Vest 2600132 | 12,92 
Centru 2360805 | 11,73 








Sud-Est 2545923 | 12,65 
Sud-Muntenia 3136446 | 15,59 
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Nord-Est | 3302217] 16,41 
| 
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Bucureşti-llfov | 2272163 | 11,29 
Sud-Vest Oltenia | 2075642 | 10,32 
| Vest 1828313 | 9,09 
| Total 20121641 | 100 





Sursa: Realizat de autor pe baza datelor oferite de INS, 2018 
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Pentru acest exemplu, un eșantion de 1000 de persoane extrase din populaţie 
va avea structura din tabelul de mai jos. 


Tabelul 3.2. Structura unui eșantion reprezentativ pe regiuni de dezvoltare 








































| Regiunea Cote | Persoane 
| Nord-Vest 12,92 | 129 
| Centru 11,73 | 117 
| Nord-Est 1641 | 164 | 
| Sud-Est 12,65 | 127 
Sud-Muntenia 15,59 | 156 
Bucureşti-llfov 11,29 | 113 
| Sud-Vest Oltenia 10,32 | 103 
Vest 9,09 91 
100 1000 











Sursa: Realizat de autor pe baza datelor oferite de INS, 2018 


Tabelul 3.3. Structura populației României pe regiuni de dezvoltare şi medii la 
recensământul din 2011 

















































































Persoane 

Regiunea Persoane Pondere__| în eşantion 

Nord - Vest Total 2600132 12,92 | 129 

Rural 1233182 47,4 6i 

Urban 1366950 52,6 68 

Centru Total 2360805 11,73 117 

Rural 992497 42 49 

Urban 1368308 58 68 

Nord - Est Total 3302217 16,41 164 

Rural 1927423 58,4 96 

Urban 1374794 41,6 68 

Sud - Est Total 2545923 12,65 127 

1183912 

1362011 53,5 65 

Sud - Muntenia 3136446 15,59 156 

Rural 1893565 60,4 94 

Urban |__1242881 396 62 

Bucureşti - Ilfov Total |__2272163 11,29 | 113 
Rural 221710 98 II | 

Urban 2050433 90,2 102 

Sud - Vest Oltenia | Total 2075642 10,32 103 

Rural 1117664 53,8 55 

Urban 957978 46.2 | 45 

Vest Total 1828313 9,09 9] 

Rural |___6926 98 37,9 34 

Urban 1135415 62,1 57 

Total România Total 20121641 100 1000 

Rural 926285] 45.9 459 

Urban____ | 10858790 541 541 








Sursa: Realizat de autor pe baza datelor oferite de INS, 2018 
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Tabelul 3.4. Structura populației României pe grupe de vârstă şi pe gen, 2016 















































































































































Grupa de vârstă | Persoane Pondere_| Eşantion 
0-4 ani Total 953912 4,83 48 
Masculin 490819 | 51.45 25 
Feminin 463093 48,55 | 23 
5-9 ani Total 1061963 5,37 54 
Masculin 544904 513 | 28 
Feminin 517059 48.69 | 26 
10-14 ani Total 1049118 531 53 
Masculin 539643 | 51,44 27 
Feminin 509475 48,56 26 
15-19 ani Total 1083079 548 | 55 
Masculin 554837 51,23 28 
Feminin 528242 48,77 27 
20-24 de ani Total 1079644 5,46 55 
Masculin 558942 | 51,77 28 
Feminin 520702 48,23 27 
25-29 de ani Total 1357286 6,87 69 
Masculin 701855 51,71 36 
Feminin 655431 48,29 33 
30-34 de ani | Total 1305682 6,61 66 
Masculin 671830 51,46 34 

35-39 de ani Total 1539105 7,19 
Masculin 783317 50,89 40 
40-44 de ani Total 1515385 7,67 77 
Masculin 777690 :51,32 40 
Feminin 737695 483,68 37 
45-49 de ani Total 1635199 8,28 83 
Masculin 838381 51,27 43 

Feminin 796518 45.73 
50-54 de ani Total 1071973 5,42 54 
Masculin 540352 50,41 27 

E Feminin | 531621 49,59 7 
55-59 de ani Total 1326453 6,71 67 
Masculin 640527 | 4829] 32 
Feminin 685926 51,71 35 
60-64 de ani Total 1345095 6,81 68 
Masculin 621556 46,21 31 
Feminin 723539 53,79 37 
|_65-69 de ani Total 1103942 | 5,59 56 
Masculin 469948 44,38 25 
| Feminin 613994 55, | 3 
70 de ani şi peste Total 2332478 11,80 118 
Masculin 895160 38,38 45 
Feminin 1437318 61,62 73 
Total România Total 19760314 100 1000 
Masculin 9649811 48,83 488 
Feminin 10110503 | 51,17 512 





Sursa: Realizat de autor pe baza datelor oferite de INS, 2018 
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În cazul în care la variabilele de control adăugăm mediul de provenienţă, se 
poate construi o structură a eşantionului prin încrucișarea celor două criterii, aşa 
cum se prezintă informaţiile din tabelul 3.3. 

Dacă într-o anchetă este importantă grupa de vârstă, distinct sau împreună cu 
alte variabile de control, se utilizează fie datele statistice de la recensământ, fie 
datele curente estimate. De exemplu, conform datelor statistice oferite de INS, pe 
anul 2016, structura populaţiei României pe grupe de vârstă şi pe gen este 
prezentată în tabelul 3.4. Cotele care se pot utiliza într-un sondaj sunt prezentate pe 
ultima coloană. 


c. Erorile de eşantionare 

O primă eroare care poate apărea într-un sondaj pe cote este eroarea de 
selecţie sau de includere în eşantion (Ardilly, 1994, p. 155). Această eroare este 
cauzată în principal de alegerea variabilelor de control. Dacă lipsesc anumite 
variabile de control sau nu au fost bine alese, apar erori care afectează direct 
calitatea rezultatelor. Această categorie de erori poate fi diminuată atât prin 
alegerea judicioasă a variabilelor de control, cât şi prin stabilirea clară a 
consemnelor pentru operatori. 

De exemplu, într-o anchetă de opinie cu privire la viaţa politică, dacă se 
consideră ca variabile de control doar vârsta şi genul, poate să apară eroarea de 
selecție prin introducerea în eşantion în mod preponderent a persoanelor de o 
anumită categorie socio-profesională, variabilă care este determinantă pentru 
opinie. 

O altă sursă de eroare de includere în eşantion o constituie actualitatea 
informaţiei cu privire la variabilele de control. În cazul în care cotele utilizate în 
eşantionare nu mai sunt actuale, rezultatul obţinut nu va mai fi „reprezentativ” 
pentru populaţia studiată. 

De exemplu, se consideră o variabilă de interes Y. La nivelul eșantionului se 
calculează o medie după relaţia: 


k k k 
L Yi N 
i=1] i=1 


Dacă însă cotele N;/N nu sunt actuale, media de la nivelul eșantionului va 
„estima” deplasat media de la nivelul populaţiei totale. 


Pa 


d. Precizia rezultatelor 

Deoarece nu se cunosc probabilitățile de includere în eșantion, nu se pot 
calcula erorile de eşantionare. Cu toate acestea, condiţiile de elaborare a unui plan 
de sondaj pe cote oferă posibilitatea aprecierii erorilor apărute în urma eşantionării. 
Se pot face câteva observaţii în acest sens. 


132 Sondajul statistic 





Deşi nu poate fi calculată, se poate presupune că varianţa unui sondaj pe cote 
este mică, adică rezultatele sunt precise. Argumentul acestei afirmaţii derivă din 
faptul că variabilele de interes sunt puternic corelate cu variabilele de control 
(pentru acestea din urmă varianţa este nulă). 

În cazul unui sondaj aleator de volum mic (n < 1000), varianţa estimatorului 
este semnificativă, fiind invers proporţională cu volumul eşantionului. Pentru un 
eşantion de acelaşi volum, un sondaj pe cote poate oferi un rezultat mai precis, cu o 
varianță mai scăzută, deşi rezultatul poate fi deplasat prin eroarea de selecţie. 
Astfel, pentru eşantioane mici, poate fi preferat un sondaj pe cote, în schimb, 
pentru eşantioane mari, sondajul probabilist dă rezultate mai bune, iar precizia 
poate fi măsurată. 


3.2.2. Probleme organizatorice specifice 


În organizarea unui sondaj pe cote, pentru a obţine rezultate de calitate, este 
esenţial să se realizeze o bună selecţie a operatorilor, să se constituie fişe de 
operatori analitice care să specifice modul de identificare a unităţilor care vor fi 
selectate și să se asigure un control permanent al operatorilor în timpul culegerii 
datelor. 


a. Operatorii şi metodele de administrare 

Există două metode de administrare a chestionarului: utilizarea operatorilor 
care să completeze răspunsurile în timpul unui interviu și autoadministrarea sau 
completarea chestionarului direct de către respondent. 

În cazul sondajelor pe cote administrate de operatori, pe lângă culegerea 
efectivă a datelor, operatorilor le revine și sarcina identificării unităţilor care 
participă la selecție. Din această pricină, această metodă de sondaj impune o atenţie 
aparte etapei de selecție şi instruire a operatorilor. 

Sondajele pe cote se pot realiza ocazional, pentru o anumită cercetare, sau 
pot fi organizate regulat, caz în care se pot utiliza operatori care au o anumită 
experiență și care cunosc detaliile anchetei. În primul caz, efortul este mai 
important, pentru că selecția operatorilor necesită un timp de lucru mai mare şi, 
implicit, există riscuri de a avea erori mai mari. În al doilea caz, se constituie o 
echipă de operatori care participă constant la anchete, iar efortul selecției și al 
instruirii se realizează o singură dată. 

Pentru selecția operatorilor este important să se ia în calcul aria geografică a 
anchetei și, pe cât posibil, să se selecteze persoane care să aibă domiciliul în 
apropierea zonei de culegere a datelor. Ideea este de a reduce cheltuielile de 
transport şi cazare, pe de o parte, dar și de a facilita procesul de identificare a 
unităților de eşantionare, pe de altă parte. 

Recrutarea operatorilor a devenit deja un subiect binecunoscut. Firmele de 
sondaje își prezintă ofertele pe site-urile de specialitate și anunță caracteristicile 
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candidaţilor şi fişa postului. De asemenea, firmele de sondaj au elaborate manuale 
pentru operatori în care sunt prezentate în detaliu cerințe pentru ocuparea unei 
asemenea poziţii, dar şi elemente de instruire care să ajute la culegerea datelor. 


Exemplu 
Pe site-ul ejobs (www.ejobs.ro) apare un anunţ pentru poziţia de operator de 
sondaj de opinie. Conform acestei surse, candidatul ideal este persoana: 
— organizată; 


| 


rezistentă la munca de teren; 
— atentă la detalii; 
—  meticuloasă,; 
- disponibilă pentru realizarea de proiecte periodice; 
— cureale abilități de comunicare; 
— cu putere de convingere şi tenacitate. 
La descrierea acestui post de muncă, apar următoarele caracteristici: 
— completarea chestionarelor pe teren cu respectarea strictă a metodologiei; 
— îndeplinirea normei de lucru; 
— respectarea programului; 
— seriozitatea; 
— raportarea periodică. 


b. Respectarea cotelor. Fişe de operatori 

Fişele de operator reprezintă instrumentul de bază pe care îl utilizează cei 
care administrează chestionarele pe teren. Aceste fişe sunt individualizate pentru 
fiecare operator și prezintă numărul și structura persoanelor care trebuie 
intervievate, precum şi o serie de informaţii suplimentare care să ajute la 
identificarea acestora. 

De regulă, fişele de operatori conţin informaţii pe baza cotelor marginale, 
calculate pentru fiecare variabilă de control. În situaţia în care se combină criterii 
care nu conduc la un număr prea mare de combinaţii și la dificultăți de selecţie, se 
pot constitui şi asemenea fișe cu cote încrucișate. Evident, pentru cotele încrucișate 
trebuie să existe informaţia disponibilă la nivelul populaţiei (în practică, asemenea 
informaţii nu sunt frecvente). 


Exemplu 

Cel mai simplu exemplu de fișă de operator cu cote încrucișate este fișa cu 
două variabile de control şi cu două valori pentru fiecare variabilă. De exemplu, 
dacă într-un studiu se utilizează variabilele gen şi mediu de provenienţă, iar un 
operator are de intervievat 10 persoane, se poate realiza o fişă de operator conform 
schemei prezentate în tabelul de mai jos. 
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Tabelul 3.5. Model fişă de operator 




















Urban Rural Total | 
Masculin 2 2 4 
Feminin 3 3 | 
Total 5 5 | 10 | 








€. Controlul operatorilor 

În cazul sondajului pe cote, controlul operatorilor este un procedeu dificil de 
realizat, în comparaţie cu sondajele aleatoare, unde se dispune de o informaţie 
privind identificarea unităţilor selectate în eșantion. Pentru sondajul empiric, 
operatorul are o anumită libertate de alegere a unităţilor, cu restricția de a respecta 
cotele şi informaţiile suplimentare privind zona geografică sau perioada de timp. 

Totuşi controlul operatorilor este important, pentru a evita apariția unor erori 
semnificative de culegere a datelor. Din pricina dificultății, o parte a acestei etape 
este transferată etapei de elaborare a fișelor de operator și a instruirii. Fișele pot 
conţine informaţii suplimentare și restricţii care să ghideze operatorul în selecția 
unităţilor, pentru a evita anumite erori predictibile (cum ar fi selecția unor grupuri 
de persoane din aceeași arie geografică sau dintr-un singur interval de timp). 


3.2.3. Avantaje și limite 


Sondajul pe cote are atât adepți, cât şi contestatari fervenţi. Este o metodă 
care are o anumită supleţe și este relativ uşor de realizat, dar admite şi o serie de 
limite care trebuie cunoscute şi asumate. 


a. Avantaje 
Metoda sondajului pe cote este cunoscută în primul rând prin calitatea 
rezultatelor, pentru că reprezentativitatea eşantionului este asigurată prin 
corespondenţa de structură cu populaţia de referință pe baza variabilelor de control. 
În comparaţie cu sondajul aleator, avantajele sondajul pe cote sunt legate de: 
— dimensiunea economică - acest tip de sondaj este mai ieftin. Costurile sunt 
mai reduse pentru că eşantionul este mai mic, cheltuielile de deplasare sunt 
substanţial reduse, iar informaţia necesară este fie gratuită, fie mult mai 
ieftină, comparativ cu informaţia necesară realizării sondajului aleator 
simplu; 
— timpul de realizare - ancheta se efectuează mai rapid. Toate etapele de 
realizare a anchetei presupun un timp mai scurt, dar în special cel de 
culegere a datelor; 


practică, deseori este imposibil de obținut, astfel că sondajul pe cote poate fi 
singura metodă accesibilă și posibil de aplicat. Acesta reprezintă un avantaj 
decisiv în practica sondajelor (Desabie, 1966, p. 54); 
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— precizie - printr-o muncă analitică şi atentă de selecţie a eşantionului, se pot 
obţine rezultate de calitate bună, comparabile cu cele ale sondajelor mixte; 

— tratarea non-răspunsurilor - dacă o persoană refuză să participe la anchetă, 
aceasta poate fi înlocuită cu una care prezintă caracteristici similare, ceea ce 
nu se poate face în cazul sondajului aleator (caz în care se mărește din start 
volumul eşantionului pentru a acoperi asemenea situaţii ). 


b. Limite 

Cea mai serioasă critică adusă sondajului pe cote este lipsa de fundament 
teoretic, baza empirică de selecție a eșantionului. O asemenea limită se prelungeşte 
în imposibilitatea de a evalua sau de a măsura gradul de precizie a rezultatelor. 
Pentru rezultatele obținute cu această metodă de sondaj nu se pot calcula intervale 
de încredere, nu se poate determina mărimea erorilor şi nu se pot realiza teste 
statistice. 

De asemenea, nu se poate calcula volumul eșantionului şi nu există criterii 
solide care să susţină alegerea unui anumit număr de unități în situaţii foarte 
diferite. Utilizarea unui număr de aproximativ 1000 de persoane este o soluţie, dar 
poate crea probleme în cazul populațiilor fie de volum mic (când eşantionul poate 
fi o pondere însemnată din populaţie), fie de volum foarte mare. 

Fără o rigoare pe măsură, sondajul pe cote poate suferi din pricina 
modalităţii de selecție a unităților. În acest caz, pot apărea erori sistematice severe, 
iar reprezentativitatea poate avea de suferit dacă nu s-au utilizat cele mai bune 
variabile de control. De exemplu, operatorii pot acoperi doar o anumită arie 
geografică corespunzătoare populaţiei de referință sau pot intervieva sistematic 
persoanele care li se par mai adecvate anchetei etc. Deşi asemenea erori pot fi 
limitate printr-o atentă instruire şi un control al procesului de culegere a datelor, 
acestea nu pot fi complet eliminate și nici suficient evaluate. 

Nu în ultimul rând, sondajul pe cote admite constrângeri legate de variabilele 
de control (Desabie, 1966, p. 57). Pe de o parte, este vorba despre dificultatea de a 
obține informaţia disponibilă pentru aceste variabile la nivelul populaţiei totale. Pe 
de altă parte, odată utilizate aceste variabile pentru structurarea populaţiei și apoi a 
eşantionului, este imposibil să fie introduse în analiza propriu-zisă. Asemenea 
variabile însă pot fi esenţiale pentru analiza temei de cercetare. 


3.2.4. Ameliorarea calităţii unui sondaj pe cote 


Ameliorarea calității unui sondaj se poate realiza fie în etapa elaborării 
planului de sondaj, fie după realizarea anchetei. Analiza posibilităţilor de 
îmbunătăţire a calității reprezintă un obiectiv esenţial al etapei de pregătire şi 
organizare a unui sondaj. Cu această ocazie, se pot identifica anumite posibilităţi de 
intervenţie asupra etapelor de realizare, odată ce s-a decis utilizarea unei anumite 
metode. Nu în ultimul rând, analizând limitele și avantajele unui tip de sondaj, se 
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poate decide asupra unor posibilități de creştere a calității rezultatelor prin anumite 
modificări la nivelul planului de sondaj sau al anumitor elemente privind costurile 
şi timpul de realizare. 

Odată realizată opţiunea pentru o anumită metodă de cercetare selectivă, 
urmează concentrarea eforturilor pe găsirea posibilităţilor de creştere a eficienţei 
metodei alese. Planul de sondaj poate fi ameliorat atât prin reducerea erorilor cu 
care se obțin rezultatele, cât şi prin reducerea costurilor şi a timpului de realizare a 
anchetei. În cazul sondajului pe cote, ameliorarea calităţii se poate face prin 
eficientizarea muncii la toate etapele realizării anchetei, dar și prin apelul la o 
metodă mixtă care să rezulte din combinarea sondajului pe cote cu metoda 
aleatoare. 

Erorile de sondaj pot fi limitate la nivelul fiecărei etape de realizare a 
sondajului: definirea problemei, construirea chestionarului, alegerea variabilelor de 
control, selecţia unităţilor, culegerea datelor, analiza statistică. Dacă există 
posibilitatea, se pot aduce elemente complementare ce pot crește precizia 
rezultatelor şi pot reduce costurile. 

Un exemplu de ameliorare a sondajului pe cote îl reprezintă realizarea unui 
sondaj în două etape. Ideea este să se utilizeze informaţia disponibilă pentru a crea 
o bază de sondaj cu unităţi complexe din populaţie obţinute cu ajutorul variabilelor 
de control. În prima treaptă, se apelează la metoda aleatoare: se extrag aleator 
asemenea unităţi complexe din populaţia de referinţă. În a doua treaptă, se 
realizează o extragere pe cote din fiecare unitate selectată aleator. 

Avantajele unei astfel de metode sunt: 

— realizarea unei bune precizii prin utilizarea unei extrageri aleatoare în prima 
treaptă; 

— reducerea costurilor de constituire a bazelor de sondaj: se construieşte doar o 
bază de sondaj cu unităţi complexe; 

— reducerea costurilor de observare prin utilizarea unei eşantionări pe cote în a 
doua treaptă. 


3.3. Metoda unităţilor tip 


Literatura de specialitate apreciază că aceasta este cea mai empirică sau cea 
mai slab fundamentată dintre metodele non-aleatoare (Ardilly, 1994, p. 163). 
Metoda unităţilor tip are ca principiu de bază împărţirea populaţiei în categorii 
omogene cu ajutorul unor variabile de control şi selectarea în eşantion a unităţilor 
care sunt cel mai aproape de media fiecărei categorii sau sub-populaţii (Desabie, 
1966, p. 44). Astfel, se admite ipoteza că unităţile tip se vor comporta similar şi în 
cazul variabilelor de interes studiate în anchetă. 

Metoda este foarte utilizată în anchetele exploratorii, ca cercetări ce 
pregătesc sondaje de volum mare și obținute cu ajutorul metodelor probabiliste sau 
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mixte. Avantajul acestei metode este acela că oferă informaţii în timp foarte scurt şi 
cu costuri reduse, iar calitatea rezultatelor este una destul de bună. Limita cea mai 
importantă a metodei este aceea că nu surprinde variabilitatea la nivelul populaţiei, 
iar în selecția unităților tip pot apărea erori sistematice. De exemplu, o unitate 
individuală care se află aproape de medie pentru o anumită variabilă nu este în mod 
necesar în aceeași poziţie în cazul altor variabile. Reprezentativitatea eşantionului 
este legată de capacitatea cercetătorului de a defini caracteristicile unităţii tip şi 
apoi a operatorilor de a identifica aceste unităţi în momentul culegerii datelor. 

Domeniul în care este cel mai frecvent aplicată această metodă este cel 
agricol sau în analiza unor probleme specifice mediului rural. În aceste situaţii, este 
mult mai uşor de a identifica unităţile tip, care pot fi gospodării, ferme sau arii de 
teren agricol bine delimitate. 

Ca şi în cazul celorlalte tehnici de sondaj empirice, metoda unităţilor tip este 
utilă în cazul studiilor exploratorii, pe eșantioane de volum mic, ce se pot realiza 
într-un timp relativ scurt și cu costuri reduse. 


3.4. Alte metode 


Cercetarea pe bază de sondaj statistic, deşi atât de cunoscută și larg folosită 
în prezent în toate ştiinţele, are o istorie recentă. Acceptarea relativ târzie a 
sondajului ca o metodă de cunoaștere ştiinţifică se datorează unor condiţii sociale, 
politice, ştiinţifice şi filosofice care s-au manifestat în partea a doua a secolului al 
XIX-lea și începutul secolului al XX-lea. Înainte de a prezenta pe scurt câteva 
dintre aceste condiţii, este important să ne oprim puţin asupra termenului care dă 
numele acestei metode. 


3.4.1. Metoda voluntariatului 


Această metodă de sondaj are la bază principiul autoselecţiei, adică 
persoanele din populaţie decid dacă să participe sau nu la anchetă în urma unei 
invitaţii. Așadar, voluntariatul reprezintă criteriul sau principiul care stă la baza 
acestei metode de selecție. În cazul acestui tip de sondaj, asupra reprezentativităţii 
eşantionului pot exista din start cele mai serioase îndoieli. Cele mai cunoscute 
modalități de organizare a acestor anchete sunt cele care apelează la mass-media 
(chestionare publicate în ziare sau reviste), la telefonie sau la mediul online 
(chestionare pe diverse pagini web), la clienţii unor firme (de exemplu, degustarea 
unor produse în magazin) sau la membrii unor asociaţii nonprofit. 

Metoda admite o serie de avantaje care derivă chiar din natura principiului 
de selecție: costul anchetei este scăzut; nu există criterii predefinite în selecţia 
unităților din populaţie; datele se culeg relativ rapid, mai ales dacă se face apel la 
structurile sociale la care participă unităţile din populaţie (familie, prieteni, membri 
într-o organizaţie). 
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Această metodă admite o limită importantă legată de caracteristicile 
populaţiei de referință. Voluntariatul reprezintă o trăsătură a unui tip de societate 
cu o anumită maturitate civică, cu o anumită disponibilitate de a participa la viaţa 
publică. Dacă o asemenea cultură este slab dezvoltată, metoda sondajului bazată pe 
voluntariat poate avea serioase erori de reprezentativitate. Chiar şi în condiții în 
care dispunem de o cultură a voluntariatului, riscul unor erori importante există, 
pentru că este imposibil de apreciat ponderea și caracteristicile celor care vor 
răspunde efectiv la anchetă, precum şi rata non-răspunsurilor. Pentru o evaluare a 
calității rezultatelor, este important să se încerce să se obțină informaţii despre 
profilul persoanelor care nu au participat la anchetă, al unităţilor cu o înclinaţie mai 
redusă pentru participarea voluntară la asemenea anchete sau la alte acțiuni cu 
caracter civic. 


3.4.2. Metoda selecţiei bazate pe accesibilitate 


Ideea de bază a acestei metode este aceea de a identifica o modalitate facilă 
de a avea acces la populaţia de referință. Principiul de selecție se referă la utilizarea 
contextelor în care un număr mare din populaţia supusă analizei se află într-un 
anumit loc și la un moment dat și pot fi ușor de abordat în vederea culegerii 
datelor. Vorbim despre locuri publice în care se găsesc suficient de multe persoane 
şi care pot fi intervievate: parcuri, magazine, muzee, gări şi aeroporturi etc. 

Pentru selecția unităţilor în eșantion, pe lângă condiţiile de spațiu și 
disponibilitate a persoanelor potenţiale, se poate aplica şi o regulă de selecție. Un 
exemplu îl constituie regula aplicată în schema extragerii cu pas de numărare: 
operatorul selectează persoanele cu o anumită frecvență, iar dacă acestea sunt de 
acord, se realizează culegerea datelor. În plus, pentru a îmbunătăți 
reprezentativitatea eșantionului, selecţia se poate realiza la diferite intervale de 
timp pe parcursul unei zile sau chiar pe parcursul unei săptămâni. În ciuda unor 
asemenea măsuri de precauţie privind reprezentativitatea, prin natura ei, această 
metodă de sondaj poate admite importante erori de selecție. Principala obiecţie 
adusă acestei idei de eșantionare este legată de faptul că este dificil de evaluat dacă 
acea parte a populaţiei de referință accesibilă într-un anumit perimetru este 
reprezentativă pentru întreaga populaţie. 

Această metodă poate ridica probleme la capitolul non-răspunsuri 
(persoanele aflate într-un spațiu public au deja un scop sau un interes, iar 
solicitarea de a participa la un sondaj poate fi privită cu refuz sau neîncredere), dar 
şi la cel al reprezentativității (dacă nu se ţine cont de variabilitatea fluxurilor de 
persoane în locurile unde se realizează selecția). 
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3.4.3. Metoda itinerariilor 


Metoda itinerariilor este o variantă a metodei cotelor. Operatorilor li se 
impune mult mai strict modalitatea de alegere a unităţilor care participă la anchetă, 
pe baza unui itinerar (un ansamblu de adrese, străzi sau zone din care se extrag 
persoane după anumite consemne clare). Această metodă se bazează pe o 
reprezentativitate spaţială a eșantionului. 

Operatorii primesc consemne clare pe o hartă a teritoriului în care se 
desfășoară ancheta, iar punctele de selecţie sunt marcate și identificate pe baza unei 
adrese. Dacă în anchetă este vizată o localitate, atunci coordonatele principale 
pentru identificarea unităţilor supuse observării sunt date de adrese, aşa cum sunt 
definite în documentele civile și administrative. Operatorii pot dispune de o listă cu 
clădiri sau cu adrese care să indice punctele de selecţie. 

Această metodă are avantajul că lasă mai puţină iniţiativă operatorilor 
(riscurile apariţiei erorilor de selecţie sunt mai mici), iar procesul de control al 
culegerii datelor este unul mai facil. De asemenea, această metodă impune 
utilizarea unor informaţii suplimentare despre populaţia de referință, o limită care 
uneori este dificil de depăşit. Uneori, asemenea anchete pot avea costuri mai 
ridicate decât alte metode de sondaj empirice, îndeosebi datorită costurilor ridicate 
cu deplasarea în teritoriu şi acoperirea întregii arii geografice. 


3.5. Exerciţii 


1. Pentru populaţia studenţilor din orașul lași se organizează o anchetă prin 
sondaj pentru a studia opinia despre situația căminelor din campus. Se cunosc 
informaţii despre structura studenţilor pe universități, facultăţi şi ani de studii. Să se 
prezinte argumente pentru ce metodă de sondaj empiric se poate opta în acest caz, 
având în vedere şi criteriul eficienţei sub raportul costului și al timpului de 
realizare a anchetei. 


2. Se consideră aceeaşi populaţie și aceeaşi temă de cercetare de la exerciţiul 
anterior, însă se presupune că nu se poate dispune de informaţiile legate de 
structura studenților pe universități, facultăți și ani de studii. Ce abordări se pot 
utiliza în acest caz pentru realizarea unui sondaj? 


3. La nivelul regiunii Nord-Est, se doreşte realizarea unei anchete privind 
activitatea agricolă a gospodăriilor din mediul rural. Dacă se apelează la un tip de 
sondaj empiric, care ar fi cel mai adecvat acestei situaţii? Motivaţi răspunsul. 


4. Ce tip de sondaj empiric se poate aplica cel mai eficient în cazul studiului 
opiniei clienţilor unui supermarket privind calitatea unui tip de produse (de 
exemplu, a produselor lactate de o anumită marcă)? 
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5. Prezentaţi pe scurt trei principii de selecţie în cazul sondajelor non- 
aleatoare. 


6. Pentru datele disponibile în tabelul 3.6, să se construiască structura unui 
eșantion de volum n = 1000 extras pe cote, utilizând variabila de control Cartierul. 
De asemenea, să se construiască structura unui eșantion similar utilizând simultan 
variabilele Cartier şi Vârstă şi folosind aceeaşi sursă de informaţii cu privire la 
structura populaţiei oraşului pe grupe de vârstă. 


Tabelul 3.6. Structura populaţiei municipiului laşi pe cartiere şi pe sexe la Recensământul 
populaţiei din 1992 






























































Nr. Cartier Persoane masculine | Persoane feminine Total pers. 
crt. nr. % nr. % nr. % 
T|Alexandru cel Bun | 29963 31295 [61258 
2| Bucium 2975 3164 6139 
3| Centru 13747 15188 28935 
4|Copou 8126 7749 | 15875 
E 5| Frumoasa 3729 3600 7329 
6|Galata 12271 12636 | 24907 
7| Moara de vânt 2983 3373 [ss |] 
8|Nicolina CUG 21673 22862 44535 ji ai 
9|Obreja 2056 | 2056 Mp] 
10| Păcurari 19051 19995 39046] |] 
11 |Socola-Nicolina 11859 13051 20| | 
12|Studenţesc 5322 5385 10707] |] 
I3|ratăraşi Ies [ese | sas | 
14|Ţicău-Sărărie 4248 6543 10791 | 
15|Zona ind. Păcurari 462 303 1765 
16| Zona ind. Ţuţora 11852] | 11274 3136 
Total laşi 166829 177450 344279 
pondere % | %| 100% 





Sursa: Fişa localităţii, Direcţia Judeţeană de Statistică laşi 


7. Considerând ancheta prezentată anterior, se cere să se elaboreze un model 
de fișă de operator care să ia în considerare: 
- variabilele Cartier şi Gen; 
-— variabilele Cartier, Vârstă şi Gen. 


8. Utilizând criteriile de alegere a unei metode de sondaj prezentate în primul 
capitol al acestei lucrări, comparaţi trei dintre cele mai importante metode de 
sondaj non-aleatoare, în contextul realizării unui sondaj cu caracter explorator cu 
privire la efectele migraţiei externe a persoanelor din orașul laşi asupra familiilor 
din care provin. 
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de creştere a eficienţei acestei metode (creşterea preciziei, reducerea costurilor și a 
timpului de realizare a anchetei). In cazul aceluiași exemplu, comentaţi 


10. Prezentaţi câteva avantaje și câteva limite ale aplicării sondajului empiric 
în contextul studiului opiniei politice la nivelul populaţiei României. 


11. În cazul unui sondaj de opinie privind activitatea administraţiilor locale 
din mediul rural din regiunea Nord-Est, dacă se aplică metoda sondajului unităţilor 
tip, prezentaţi o variantă de plan de sondaj pentru realizarea anchetei. 








“f 


| 
| 
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SONDAJE MIXTE 


Planurile de sondaj mixte" presupun utilizarea a două criterii de selecţie de 
natură diferită în procesul de extragere a unui eşantion din populaţia de referință. 
Ideea sondajelor mixte este legată de posibilitatea de a îmbunătăți calitatea 
sondajelor clasice, aleatoare și empirice, prin crearea unor planuri de sondaj care 
combină elemente metodologice specifice celor două tipuri de anchete. Rezultatul 
este reprezentat de planurile de sondaj mixte. În acest capitol ne oprim asupra a trei 
dintre cele mai utilizate metode de sondaj mixte: sondajul stratificat, sondajul în 
două sau mai multe trepte și sondajul pe serii (cluster). 


4.1. Justificarea metodelor mixte 


Combinarea celor două procedee clasice de selecţie într-un plan de sondaj 
mixt se bazează pe principiul eficienţei activităţii de cercetare. În primul capitol al 
acestei lucrări au fost prezentate câteva criterii care pot fi utilizate în decizia sau 
opţiunea pentru o anumită metodă de sondaje. Aceste criterii sunt: informația 
disponibilă, precizia rezultatelor, costul, timpul de realizare a anchetei, natura 
populaţiei de referință, volumul eşantionului, tema de cercetare. În cazul unei 
anchete concrete, aceste criterii capătă importanţă diferită, iar sarcina cercetătorului 
este aceea de a găsi această ordine de importanță și de a lua o decizie în consecinţă. 
Dacă nu există condiții predeterminate (în special de timp și de cost), decizia 
pentru un anumit plan de sondaj presupune identificarea unei soluţii ca urmare a 
analizei detaliate a criteriilor menționate mai sus. 


! În literatura de specialitate, sintagma sondaje mixte este folosită cu două accepțiuni. Prima vizează 
planurile de sondaj mixte, adică se referă la ideea de a construi un plan de sondaj ce se bazează pe 
două principii de selecţie diferite ce se aplică după un demers bine stabilit. A doua vizează utilizarea 
celor două tipuri de abordări metodologice clasice, cantitativă şi calitativă, într-o cercetare prin 
sondaj. În această lucrare ne referim la sondajele mixte în prima accepțiune, adică la planuri de sondaj 
mixte. 
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Metodele de sondaj clasice au o serie de limite (discutate în capitolele 
anterioare) care pot fi îndepărtate sau ajustate prin combinarea elementelor 
metodologice specifice fiecărei metode în parte. Sondajele mixte au la bază ideea 
de a creşte eficiența sondajelor clasice, aleatoare și empirice. Eficienţa este 
înţeleasă în principal prin prisma rezultatelor obţinute, însă sunt luate în calcul și 
timpul şi costul anchetei. Pentru sondajele care combină cele două principii de 
selecţie, se utilizează o serie de criterii de analiză pentru a decide asupra celui mai 
bun plan de sondaj. 

Informația suplimentară este cerută de sondajele empirice, cele aleatoare nu 
necesită o asemenea limită. Însă, dacă o asemenea informaţie este accesibilă, poate 
fi folosită împreună cu principiul selecţiei aleatoare pentru a obține un sondaj mai 
eficient. Sondajele aleatoare sunt, în general, de volum mare şi necesită un timp şi 
un cost mai ridicat. Prin utilizarea informaţiei suplimentare, de regulă, volumul 
eșantionului se poate reduce pentru a obţine aceeași precizie a rezultatelor. De 
asemenea, prin apelul la un plan de sondaj mixt, sunt șanse să scadă costurile şi 
timpul de realizare a anchetei. 

În opţiunea pentru sondajele mixte, un rol important îl pot avea natura 
populaţiei şi tema de cercetare. Dacă populaţia studiată admite o structură 
particulară sau permite organizarea pe grupe cu o omogenitate ridicată, atunci este 
preferabil să se ia în considerare aceste elemente, iar eșantionul să păstreze 
asemenea coordonate. De exemplu, se poate lua în considerare structura pe medii a 
gospodăriilor, structura teritorială a ariilor urbane (cartiere, zone), tipul locuinţelor 
din oraşe (case și blocuri), regiunile de dezvoltare economică, regiunile istorice, 
zonele geografice şi climaterice etc. 

Sondajele empirice pot fi obţinute mai repede în timp şi cu un cost mai 
redus, însă principala problemă o reprezintă imposibilitatea de a măsura gradul de 
precizie al rezultatelor, așa cum se întâmplă în cazul sondajelor aleatoare. Prin 
combinarea celor două metode, se obține o metodă de sondaj pentru care se pot 
estima erorile de sondaj, iar rezultatele sunt garantate cu o anumită probabilitate. 
Chiar dacă există condiţii de cost și de timp impuse, prin mixarea celor două 
metode de sondaj clasice, se obţin rezultate cu o precizie foarte bună, uneori 
superioară oricăreia dintre cele două metode clasice, iar, în plus, se obține şi o 
măsură a erorilor de sondaj. 

Trecerea de la sondajul aleator simplu la cel mixt presupune o analiză a 
manierei în care se modifică: etapele planului de sondaj, în special extragerea 
eşantionului din populaţia de referință; relaţiile şi proprietăţile estimatorilor 
utilizați pentru estimarea parametrilor; precizia rezultatelor; volumul eșantionului 
în funcţie de o anumită precizie dorită; costul și durata de realizare a sondajului. 
Aceste aspecte vor fi discutate în următoarele subcapitole pentru sondajul 
stratificat, sondajul în două sau mai multe trepte şi sondajul pe serii. 
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4.2. Sondajul stratificat 


Sondajul aleator simplu presupune extragerea unui eșantion din populaţia de 
referință fără a lua în considerare elemente privind structura acelei populaţii sau 
gradul său de omogenitate. Nivelul de precizie al rezultatelor obţinute cu ajutorul 
sondajului aleator simplu depinde de volumul eşantionului şi de nivelul varianţei 
populației. În acest caz, creșterea preciziei se poate realiza fie prin creşterea 
volumului eșantionului, fie prin reducerea gradului de eterogenitate a populaţiei. 
Cea de-a doua posibilitate stă la baza metodei de sondaj prezentate în această 
secțiune. 

Cel mai cunoscut și aplicat sondaj mixt este sondajul stratificat. Numele 
provine de la ideea de bază a acestei metode, şi anume de a realiza selecția 
aleatoare după ce populaţia de referință a fost structurată în grupe sau straturi cu 
ajutorul unei variabile de control puternic corelate cu variabila de interes. 


4.2.1. Principiul metodei 


Sondajul stratificat are la bază ideea de a combina principiul selecției 
aleatoare cu cel al eșantionării empirice prin utilizarea unei informaţii suplimentare 
despre structura populației. Practic, putem vorbi despre o combinaţie între sondajul 
aleator simplu şi sondajul pe cote. Informaţia suplimentară conduce la o structurare 
a populaţiei de referință pe grupe sau straturi care au o omogenitate mai ridicată 
decât întregul. De exemplu, în cazul unui sondaj de opinie la nivelul României, 
există mai multe posibilități de stratificare: pe medii de proveniență (rural și 
urban); pe regiuni de dezvoltare; pe judeţe; după mărimea localităţilor etc. 

Rezultatul stratificării depinde de omogenitatea straturilor în raport cu 
variabila de interes. Principiul stratificării vizează asigurarea unei reprezentativităţi 
la nivel de eşantion a unei structuri existente la nivelul populaţiei. Acest lucru 
presupune obţinerea unei omogenităţi ridicate la nivelul fiecărui strat şi realizarea 
unor diferențe semnificative între straturi. Variabila după care se realizează 
gruparea trebuie să fie puternic corelată cu tema de cercetare. Structurarea 
populaţiei pe straturi presupune cunoașterea ponderilor grupelor din total sau a 
numărului de unităţi din populaţie din fiecare strat. În practică, aceste tipuri de 
sondaje au la bază o structurare a populaţiei pe criterii cum ar fi cele geografice 
(regiuni sau arii cu trăsături specifice), administrative (unităţi administrativ 
teritoriale), economice (regiuni de dezvoltare, sectoare de activitate) etc. Metoda 
stratificării conduce la atingerea a două obiective: creșterea calităţii estimaţiilor 
obținute; asigurarea reprezentativității eșantionului la nivelul unor categorii 
distincte de unități din populaţie (la nivel de straturi) ce sunt considerate de mare 
importanță pentru cercetare. 

Metoda sondajului stratificat presupune construirea unui eșantion în două 
etape (vezi tabelul 4.1). Mai întâi se realizează o partiţionare sau stratificare a 
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populației cu ajutorul unei variabile de grupare. Aceste straturi pot avea același 
număr de unităţi sau mărimea lor poate să difere. În pasul al doilea se aplică 
metoda selecţiei aleatoare simple la nivelul fiecărui strat. Eșantionul final se obține 
ca urmare a acestor selecții de sub-eşantioane independente, iar condiţiile de 
calitate ale acestuia se pot determina uşor pe baza acestei proprietăți. 


Tabelul 4.1. Principiul selecției stratificate 


























Straturi Extragere aleatoare 
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Condiţia de independenţă a extragerii unui număr de unităţi din fiecare strat 
permite utilizarea unor metode de selecție diferite pentru fiecare strat în parte. Mai 
precis, din unele straturi se poate extrage aleator simplu, iar din altele se poate 
aplica extragerea cu probabilități inegale. Această proprietate arată flexibilitatea 
sondajelor stratificate, iar modalitățile de extragere de la nivelul fiecărui strat 
depind de informaţiile suplimentare existente şi de natura straturilor, aşa cum au 
fost construite cu ajutorul variabilei de grupare. În această lucrare, considerăm 
aceeaşi schemă de extragere aleatoare simplă din toate straturile. Mai trebuie 
subliniat că independenţa extragerilor este importantă pentru construcţia 
estimatorilor parametrilor, în special pentru varianța acestora (varianța la nivel de 
eşantion se obţine ca sumă a varianțelor la nivel de straturi). 

Sondajul stratificat asigură ameliorarea calităţii unui sondaj aleator simplu 
prin reducerea varianţei estimatorilor, adică se realizează o creştere a preciziei 
rezultatelor. De asemenea, prin creșterea nivelului de omogenitate la nivelul 
straturilor, se poate reduce volumul eşantionului, comparativ cu sondajul aleator 
simplu, ceea ce presupune un cost mai redus și un timp de realizare mai mic. 
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Notăm cu X variabila de stratificare şi cu Y variabila de interes. De 
asemenea, notăm cu H numărul de straturi, iar cu N, volumul fiecărui strat, 
respectând condiţia: 


Pe lângă necesitatea cunoașterii ponderilor HE „ sondajul stratificat presupune 


realizarea unei baze de sondaj la nivelul fiecărui strat. Eşantionul se obţine prin 
extragerea aleatoare simplă a câte unui sub-eşantion de unităţi n, din fiecare strat, 
respectând condiţia: 


Deşi cunoaşterea structurii populației după o variabilă puternic corelată cu 
tema de cercetare impune un cost în plus, această situaţie poate fi compensată prin 
câştigul adus de facilitarea procesului de observare şi prin reducerea volumului 
eşantionului. 

Prin stratificare, varianţa totală a variabilei de interes se descompune în două 
componente: varianţa explicată (berween) sau varianța mediilor condiţionate de la 
nivelul straturilor şi varianţa reziduală (wifhin) sau media varianţelor condiționate 
de la nivelul fiecărui strat: 


vw = io o Se ca=u e toi 


unde 


Ca urmare a principiului stratificării, în analiza proprietăţilor estimatorilor se 
ia în calcul doar varianţa de la nivelul straturilor, adică varianţa intra-strat. 
Stratificarea este cu atât mai eficientă cu cât straturile sunt mai omogene sau 
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varianţele la nivel de straturi sunt mai mici. De regulă, stratificarea are impact 
asupra erorilor de estimare, acestea fiind mai mici decât în cazul sondajului aleator 
simplu, pentru că varianţa intra-straturi este mai mică decât varianța totală. 


Problemele stratificării 

Stabilirea variabilei de stratificare. Stratificarea aduce rezultate cu atât mai 
semnificative cu cât prin structurarea populaţiei se realizează o varianţă între 
straturi mai mare (preia cât mai mult din varianța totală) şi deci o omogenitate mai 
mare în interiorul straturilor. Problema cea mai dificilă o constituie faptul că 
variabila de stratificare trebuie cunoscută la nivelul populaţiei de referinţă: aceasta 
asigură repartizarea fiecărei unităţi individuale într-un strat de volum N. 
Cunoaşterea informaţiei suplimentare la nivelul populaţiei totale reprezintă o 
restricție importantă, atât de cost, cât şi de posibilitate practică. Din punct de 
vedere teoretic, este convenabil un număr cât mai mare de straturi, însă, din punct 
de vedere practic, acesta trebuie limitat la un număr care să răspundă atât 
condiţiilor economice, cât şi celor de precizie. 

Stabilirea numărului de straturi. În primul rând, numărul de straturi depinde 
de variabila de stratificare, de variantele sau valorile posibile ale acestei variabile. 
În practică, însă, numărul straturilor este ales în funcţie de mai multe criterii: 

— costul - care creşte odată cu creşterea numărului de straturi; 

— precizia rezultatelor - care scade odată cu creşterea numărului de straturi; 

— posibilităţile de eşantionare - nu pot exista straturi cu o singură unitate (nu se 
poate calcula varianța) sau chiar cu un număr mic de unităţi. 

Repartizarea eşantionului pe straturi. După ce a fost aleasă variabila de 
stratificare şi s-a fixat numărul de straturi, rămâne să se aleagă metoda prin care se 
compune eșantionul final din cele H sub-eșantioane care se extrag aleator din 
fiecare strat. Această problemă, numită alocare, presupune stabilirea procedeului 
după care se determină valorile ny. Asupra acestui subiect ne oprim într-o secțiune 
ulterioară. 


Observaţie 
În cazul sondajului stratificat, numărul de eșantioane posibil de extras din 
populaţie este mai mic decât cel din cazul sondajului aleator simplu: 


— pupe, ,rhH n 
K = Cp * Cyg2 * mu" Cu S CA 


Ca o concluzie la cele prezentate mai sus, prin stratificare se vizează o serie 
de avantaje: 
— creşterea preciziei rezultatelor prin reducerea erorilor de estimare; 
— o mai bună calitate a procesului de culegere a datelor prin utilizarea unor 
strategii diferite în funcţie de natura straturilor; 
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— reducerea costului unitar prin reducerea costurilor de transport şi culegere a 
datelor; 

— obținerea de rezultate (estimaţii ale parametrilor și ale erorilor) și la nivel de 
straturi, şi la nivelul populaţiei totale; 

— utilizarea unor procedee de selecție și a unor metode de culegere a datelor, 
care pot fi diferite la nivel de strat; 

— creșterea nivelului de reprezentativitate a eșantionului; 

— reducerea timpului de realizare a anchetei. 


4.2.2. Estimarea parametrului medie 


Pentru variabila de interes Y, parametrul medie este: 


N 
1 
Hu = 2 
i=1 


În condiţiile stratificării, media se poate determina în funcție de valorile 
variabilei la nivel de straturi și de mediile la nivel de strat: 





unde 


reprezintă media variabilei de interes la nivelul stratului h. 
Pentru sondajul stratificat, un estimator nedeplasat pentru ui se obţine ca o 
medie de forma: 


1 


(E. eta AN 
Ust N Hnlin 


D= 


h 


N 
- 


O valoare a estimatorului As, la nivelul unui eşantion este o estimaţie ce se 
obţine cu ajutorul relaţiei: 
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Se poate observa că estimaţia mediei se obţine ca o medie a mediilor de 
sondaj pentru cele H sub-eșantioane, ponderate cu ponderile straturilor la nivelul 
populației. 

În cazul unui sondaj aleator simplu, estimatorul mediei este media de 


selecție: 
n 
sai 


izi 


31 


cu Y; variabile aleatoare de selecție independente și identic distribuite cu variabila 
de interes la nivelul populaţiei totale. 

Acest estimator se mai poate construi cu ajutorul estimatorilor construiți 
pentru fiecare sub-eșantion, potrivit selecției aleatoare simple. Notăm aceşti 
estimatori cu îp,h = 1,H. 

Se poate demonstra că estimatorii mediilor la nivel de strat sunt nedeplasați 
şi convergenţi. Au loc relaţiile: 

Ein) = un 
N — nn O 
V(AÂn) = — 
(An) Nu hp 


Pentru sondajului aleator simplu, estimatorul mediei populaţie este: 


iar estimaţia, media de eșantion, este: 


n H 
zid 1 
d adm 

i=1 h=1 
Observaţie 


Se poate observa imediat că estimaţia punctuală a mediei diferă de media 
eşantionului obținut prin stratificare: 


Rezultă că media de eşantion nu este estimația punctuală a parametrului 
medie. Evident, ceea ce diferă în cele două expresii sunt ponderile. 
Dacă se consideră ponderile la nivel de populaţie și eșantion egale: 
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atunci jis = fi, respectiv Ys = Y. 
In acest caz, sondajul stratificat se numeşte reprezentativ sau proporțional, 
iar media de eșantion este estimaţia punctuală a parametrului medie. 


a. Proprietăţile estimatorului mediei 
Am arătat că un estimator al medie pentru sondajul stratificat este: 


PRE 
As = > În N 
i 


Se poate arăta că estimatorul este nedeplasat: 


E (As) = (m pu )- > EA )N = > HN = 


Potrivit principiului stratificării, în varianţa estimatorului se iau în calcul 
doar varianţele grupelor sau straturilor. De asemenea, în determinarea erorilor de 
estimare se ia în considerare doar extragerea aleatoare fără revenire, pentru că prin 
stratificare se obţin sub-populaţii cu un volum N, considerabil redus. Condiţia de 
independenţă a extragerilor permite determinarea varianţei estimatorului mediei 
după relaţia: 


H H HE ua 5 
Va) 22 Niv v(a,) 22 Ni suie Sa 
Hst) > 72 Un) = 2rz zu PD e 
st o N2 2 ho N2 Za Mn N? Na na 
sau 
H 
j Ni di, 
VA) = dU fo) 
N 
h=1 
unde 
Nh — fn Oi 
V(in) = ea 
(An) N n 


este varianţa estimatorului mediei de strat, iar 
fn = Sh 


este fracţia de sondaj la nivel de strat. 
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b. Estimarea mediei prin interval de încredere 
Pentru calculul intervalelor de încredere, se utilizează un estimator al 


varianţei de mai sus: 
H 
2 212 
32 = a Pa 
As N2 N n 
E=i h h 


unde 6,2 reprezintă varianţa de selecţie modificată la nivel de strat sau estimatorul 
varianței la nivelul unui strat. 

Intervalul de încredere se obţine pe baza proprietăţilor estimatorului pentru 
parametrul medie, în principal al convergenţei în repartiție. În acest sens, se 
utilizează o statistică Student: 

fise 


t = 3 
9âse 





iar intervalul de încredere este: 
(Ase e ta/28aş,)) 
La nivelul unui eşantion, intervalul de încredere estimat este de forma: 
(se + ta /2Sâs.) 


unde 


2 12 
hi Na — Na Sh 


W 
DN 
a 

| 
DA 

| z 
N 


NA nn 


iar S;2 sunt estimaţiile varianţelor la nivel de eșantion corespunzătoare varianțelor 
la nivel de strat: 


1 
spe = Fa Dor — In)? 
L= 


Observaţia 1 

Rezultatele obținute pentru parametrul medie sunt similare pentru parametrul 
proporție. 

Considerăm parametrul 7 şi proporţiile la nivel de strat 7p. 

Estimatorul nedeplasat al proporției este: 


1 H 
is == D, în Na 
h=1 
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iar estimaţia 


1 H 
Wst = —D Win Nn 
rezi 


unde w, sunt estimaţiile proporţiilor la nivel de strat. 
Pentru calculul de precizie se utilizează estimatorul varianţei: 


H A A 
Da NE N — nn În (1 — în) 


îs LINZ N n 
RI h h 


iar estimaţia este: 


H 
Da NP Na — na Wn(l — Wp) 
See DAN 


N n 
zi h h 


Observaţia 2 
In cazul sondajului stratificat, se poate estima şi valoarea globală sau totalul. 
Dacă notăm cu îs, estimatorul totalului în cazul unui sondaj stratificat, iar cu î, un 
estimator nedeplasat al valorii globale la nivel de strat, rezultă: 
în = An Nn 
sita de d ai, 
V(în) = NAC — fn) a 


H H 
2 d tn 3 An Ne = N fs 


h=1 h=1 
A 2 

A 2 Op 
Vo) = d NZU = fo 
h=1 h 


Observaţia 3 
i . E . . ama AVI n , 
Dacă se consideră sondajul proporţional, adică ara = = = f, atunci 


estimatorul mediei este de forma: 
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iar estimaţia este: 





c. Câștigul de precizie al stratificării 

Se poate demonstra că varianţa estimatorului obținut prin stratificare este 
mai mică decât a estimatorului obținut prin selecție aleatoare simplă. Această 
diferență se numește câștig de precizie datorat stratificării. 

Fie 6 estimatorul obţinut pentru parametrul 8 în cazul sondajului aleator 
simplu şi Gs estimatorul obţinut prin metoda stratificării. Atunci, câştigul de 
precizie absolut (C.) şi relativ (C,) se pot scrie: 


Ca = v(8) i V(6+) 


_V(6) —V(6s) 
a V(8) 

Criteriul după care se va alege variabila de stratificare este următorul: dintre 
toate variabilele de stratificare posibile, se va alege variabila pentru care câştigul de 
precizie este cel mai mare. 

Pentru exemplificarea câștigului de precizie, considerăm parametrul medie. 
Estimatorul clasic, obţinut într-un sondaj aleator simplu, este: 


H 
» Hh?h 
h=1 


Acest estimator este nedeplasat şi are varianţa: 


N —no? 


N n 


A= 


>Il= 





V(4) = 


sau 


2 
vB = u-p7 





i 
| 
i 
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Conform principiului stratificării, varianța populaţiei se descompune după 


relaţia: 
NA N 
h 
zi d me pn pr >. 9 
h=1 h=1 


Considerând cazul sondajul stratificat proporţional (CE = Z: = f), putem 
h 


scrie varianţele celor doi estimatori ai mediei: 











H H N 
A h 
V(A) = aa e (ip ee d 27 Oh 
h=1 h=1 
H 2 2 H 
Va) = Pa a LL az 
Sp N2 N n n pp 
H=i h=1 


În aceste condiţii, câștigul de precizie prin stratificare este: 


Ca = VA) = Val LL (un — Hu)? 


VAD —V(âs) _ 12 3i A (ua MP FI N (un =) 


DD e af > pr 
n 





Observația 1 

Câştigul absolut de precizie este reprezentat de varianța inter-straturi. 
Aceasta poate prelua o parte importantă din varianţa totală dacă se realizează o 
bună stratificare. 


Observația 2 

Câştigul relativ de precizie al stratificării este echivalent cu raportul de 
corelaţie dintre variabila de interes şi variabila de stratificare. Într-adevăr, la 
numărător este varianţa explicată sau varianța dintre grupe, iar la numitor este 
varianţa totală: 


V 


In concluzie, precizia obţinută prin stratificare este cu atât mai mare cu cât 
raportul de determinaţie dintre variabila de interes şi cea de stratificare este mai 
mare, adică cu cât legătura dintre cele două variabile este mai puternică. 
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Deoarece 0 < n2y < 1, rezultă: 

- un câştig zero sau nici o diferenţă între stratificare şi sondajul aleator simplu 
când între cele două variabile nu există nici o legătură; 

- un câştig maxim când legătura dintre cele două variabile este funcţională; 

- un câştig relativ de precizie prin stratificare dacă 0 < nîy <1. 

Ca o măsură a eficienţei relative a două metode de sondaj (determinată pe 
baza preciziei), se poate determina un indicator definit prin inversul raportului 
varianţelor estimatorilor obţinuţi prin cele două metode pentru un anumit 
parametru (Yates, 1953, p. 265). 

De exemplu, eficienţa sau precizia relativă a unui sondaj stratificat faţă de un 
sondaj aleator este dată de raportul: 

va) Esta îi 2 (a — 02 + So, ho] 


VA) E E, n op 





N N 
VA) _ Xh=app (n — H+ Ph 7 Oh 





V(â) N 
(se) SE : TEO 
N 
(BD Xa pn 
V(A.) N 
(As) pasă i To 


Din relaţia de mai sus se poate observa că, în general, prin stratificare se 
obţine un câştig de precizie, cu excepţia cazului în care raportul din ultima relaţie 
ar fi egal cu zero, ceea ce înseamnă că varianţa dintre straturi este egală cu zero, 
adică stratificarea nu produce diferenţe între unităţile populaţiei. 


Exemplu 

Pentru o companie de 10000 de angajaţi, se realizează un studiu privind 
disponibilitatea acestora de a lucra un număr de ore suplimentare pe săptămână. Se 
consideră o grupare a angajaţilor firmei după criteriul educaţie, după cum urmează: 
10% studii medii, 65% studii superioare de licenţă, 25% studii postuniversitare de 
master. La nivelul eșantionului extras de 1000 de angajaţi, se cunosc următoarele 
rezultate privind variabila timp de lucru suplimentar (ore pe săptămână): 





| Mediu 
| 150 





















| 
! 
| 
| 
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Se cere: 

— să se estimeze punctual și prin interval de încredere timpul mediu de lucru 
suplimentar la nivelul întregii populaţii, cu o încredere de 0,95; 

— să se testeze dacă media populaţiei totale diferă semnificativ de valoarea 
dorită de angajator de 2 ore pe săptămână ca timp suplimentar de lucru pe 
angajat. 

Conform datelor de mai sus, estimaţia mediei la nivel de eșantion se 
calculează astfel: 


unde N, sunt obţinute pe baza ponderilor din enunţ: 
N, = 1000; N> = 6500; N3 = 2500. 
Rezultă: 


a 1 
Yse = aaa (3: 1000 + 2: 6500 + 1: 2500) = 1,85 ore 


Pentru intervalul de încredere, se utilizează relaţia: 


(se £ ta/2Sâs:) 


unde 


Din tabelul Student se citeşte valoarea ta/2 = 1,96, pentru că eșantionul este 
de volum mare. 
Din calcule rezultă sg, = 0,00047, iar sa, = 0,021. 
st st 


Intervalul de încredere estimat, pentru o probabilitate de 0,95 este: 
(se £ Capa, ) > (1,85 + 1,96 : 0,021) > (1,85 + 0,041) ore 


Pentru a doua cerinţă, avem cazul unui test Student de egalitate a mediei 
populației cu o constantă. Ipotezele statistice sunt următoarele: 


Ho:u = 2 
H:us2 
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Valoarea calculată a testului se obţine astfel: 


Yu, —2 1,85—2 
tealc Ș dt remi DI, led, 


Sau, 0,021 


Pentru o încredere de 0,95, se observă că |tcar| > 1,96, adică se respinge 
ipoteza nulă. 


4.2.3. Construirea eșantionului 


În cazul sondajului stratificat, construirea eşantionului presupune câteva 
etape importante: stabilirea volumului eșantionului; repartizarea acestui efectiv la 
nivelul straturilor, etapă numită alocare; extragerea efectivelor n de la nivelul 
fiecărui strat, conform schemei de extragere stabilite. 


a. Calculul volumului eşantionului 

Pentru determinarea volumului eșantionului, se utilizează aceleași situaţii și 
relaţii de calcul prezentate pentru cazul sondajului aleator simplu. Singura diferenţă 
este aceea că în calcul se ia în considerare doar o componentă a varianței totale, şi 
anume varianţa intra-straturi notată: 


H 
o 
h=1 
De exemplu, dacă variabila de interes este una numerică şi se fixează o 
limită pentru eroarea maxim admisibilă, volumul eşantionului se poate calcula 
după relaţia: 


2 


2202 
z 


n = = 
2g2 


N 


iar A, este o valoare stabilită a erorii maxim admisibile pentru parametrul medie. 





2 
Aâ + 


Deoarece 5? < g?, volumul eșantionului pentru cazul sondajului stratificat 
este mai mic decât cel calculat pentru cazul sondajului aleator simplu. 


Exemplu 

Considerăm cazul unui sondaj care studiază consumul lunar de ciocolată 
pentru o populaţie de 10000 de persoane. Populaţia este stratificată pe grupe de 
vârstă, iar dintr-un studiu anterior se cunoaşte varianţa intra-strat, care este egală cu 
50000. Se cere să se estimeze volumul eşantionului care trebuie extras aleator fără 
revenire, dacă se dorește să se estimeze consumul mediu de ciocolată cu o eroare 
standard care nu depăşeşte 10 grame pe o persoană, cu o probabilitate de 0,95. 
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Se cunosc relaţiile: 
no 


ho 
1+3) 





n = 


zi gi 


AZ SE? 


z2 





no = 


Înlocuind în relaţiile de mai sus, se obține: 
ng = 500 de persoane, iar n = 476 de persoane. 


b. Alocarea volumului eșantionului 

Din punct de vedere teoretic și practic, există cel puţin trei posibilități sau 
tipuri de alocare: simplă, proporțională, optimală. 

Alocarea simplă 

Metoda presupune extragerea aleatoare simplă din fiecare strat a unui număr 
egal de unități care să compună eşantionul. Rezultă că: 


n 

a Ea e Poe Up E 

În condiţiile alocării simple, analiza datelor obţinute pe baza unei asemenea 
metode ar putea permite testarea existenţei unor diferenţe ce există între straturi, 
dar asumând ipoteza egalităţii varianţelor la nivel de strat. Dacă o asemenea 
ipoteză nu este valabilă, pentru verificarea diferențelor dintre straturi pentru 
parametrul medie, de exemplu, este necesar să se utilizeze o altă metodă de alocare. 


Alocarea proporțională 
Această metodă porneşte de la ideea de a extrage din fiecare strat un număr 
de unități proporțional cu mărimea stratului: 


N =nNh-— 
î N 


În aceste condiţii, sondajul se numeşte stratificat reprezentativ sau 
proporţional, deoarece se utilizează fracţia de sondaj (f) la nivelul fiecărui strat: 


sau 
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Pentru estimarea punctuală și prin interval de încredere a medie se utilizează 
relaţiile: 





RZ1 
(3 E ta/25p) 
câ SU e 
H n n h 
AZ 


În practică, acest tip de alocare este frecvent utilizat datorită simplităţii 
aplicării metodei și a facilități calculelor privitoare la estimaţii și erori, chiar dacă 
rezultatele nu respectă neapărat condiţia de optim în privinţa preciziei. 


Alocarea optimă (Neyman) 

În condiţiile stratificării, ştiind că eşantionul este compus din mai multe sub- 
eşantioane extrase din straturi relativ omogene, se pune problema repartizării 
volumului eşantionului pe cele H straturi astfel încât să se obţină cea mai bună 
precizie a estimatorului mediei variabilei de interes. Optimizarea presupune 
determinarea valorilor n care minimizează varianţa estimatorului parametrului 
care se dorește a fi estimat prin sondaj. 

Cu alte cuvinte, avem o problemă de optim cu legături de forma: 


min V(Âsc) 
nh 

(P)4 < 
> nn >n 
h=1 


Conform metodei  multiplicatorului Lagrange, rezolvarea problemei 
presupune anularea derivatelor parţiale de ordinul întâi aplicate relaţiei: 


H 
L(na, na, hp) = V(is) +4 Î Tip = 
h=1 


unde 


H Ard 2 
Ni Na — nn OA 


N2 N n 
pa n n 


V (As) = 





| 
| 
| 





| 
| 
| 
| 





i 
i 
ş 
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Deci, 
0 e eo Mai Oi sea 
În N2nî 
Pentru 
aL NA o? 
Su — Na +1 = 
adică 
E „a Nfof 
sau 
1 
Na = Tin AnCh 


Din ultima relaţie se observă că minimul varianţei estimatorului se realizează 
în condiţiile în care volumul fiecărui sub-eşantion este proporţional cu abaterea 
medie pătratică din stratul din care a fost extras. 


Știind că XH_, nn = n, din ultima relaţie se poate observa că: 


2 
1 = Yi Nnoh 
n-N 


iar prin înlocuire se obţine relația repartiţiei optime a eşantionului pe cele H straturi 
sau alocarea optimală Neyman: 
NHOR 


Np = Pee 
H 
Dia Nh9h 


Relaţia de mai sus ne oferă o relaţie de proporţionalitate: 
Th n ț 
—— = Sp ——— = const, 

NhOh Xa NnOh 


În mod analog, dacă se consideră costul anchetei fixat dinainte, se poate 
realiza o alocare în funcţie de costul unitar de sondaj la nivelul fiecărui strat (c, ): 


Th C 


Nh9h E, ia NA Oh] Ch 
Ch 


= const. 
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unde 


H 
C pă Cnhh 


h=1 


reprezintă costul total al anchetei şi este fixat. 
Rezultă: 


și Nh9h/ACh 
XE 1 (Nnoh/XCn) 


În cazul alocării optimale, se poate demonstra că estimaţia varianţei 
estimatorului mediei este de forma: 


Np = 


iar aceasta este mai mică decât în cazul alocării proporţionale. 


Observaţii 

1. Din fiecare strat se va extrage un sub-eşantion cu atât mai mare cu cât: 
— volumul stratului este mai mare; 
—  varianţa stratului este mai mare; 
- costul unitar de anchetă din fiecare strat este mai mic. 

Limita acestor alocări optimale este determinată de cunoaşterea varianțelor 
din fiecare strat, precum şi a costurilor unitare din fiecare strat. 

2. Dacă eşantionul obţinut este optim pentru o variabilă de interes Y, nimic 
nu garantează că este la fel şi pentru o altă variabilă. În aceste condiţii, este 
preferabil să se utilizeze sondajul stratificat proporţional. 

3. Dacă se înregistrează acelaşi cost unitar în fiecare strat, alocarea optimală 
se realizează doar în funcţie de varianţa din fiecare strat. 

4. Câştigul de precizie adus de alocarea optimală este important doar dacă 
varianţele de la nivelul straturilor diferă semnificativ între ele. 

5. Alocarea optimală depinde de cunoaşterea varianţei fiecărui strat după 
variabila de interes. Această constrângere poate ridica probleme deosebite în 
practică, deoarece aceste mărimi de obicei nu sunt cunoscute. Varianţele pentru 
fiecare strat pot fi estimate fie pe baza unor informaţii din anchete anterioare, fie 
prin realizarea unei pre-anchete. 


Exemplu 
Pentru o companie de 10000 de angajaţi, se realizează un studiu privind 
disponibilitatea acestora de a lucra un număr de ore suplimentare pe săptămână. Se 
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consideră o grupare a angajaților firmei după criteriul educaţie, după cum urmează: 
10% studii medii, 65% studii superioare de licenţă, 25% studii postuniversitare de 
master. La nivelul eșantionului extras de 1000 de angajaţi, se cunosc următoarele 
rezultate privind variabila timp de lucru suplimentar (ore pe săptămână): 














| | Mediu | Licenţă | Master 
|n | 150 | 500 |] 350 
Eee ei 
| s2 | 144 | 049 | 0,09 








Se cere: 

— să se estimeze punctual şi prin interval de încredere parametrul medie în 
condiţiile unui sondaj stratificat proporţional; 

— să se testeze dacă media populaţiei diferă semnificativ de 2 ore pe săptămână 
ca timp suplimentar de lucru. 
În acest caz, estimaţia mediei este identică cu media obţinută la nivelul 


eşantionului: 
H 
d Ynhn 
R=1 


De asemenea, în cazul alocării proporționale, se foloseşte estimatorul: 


3l= 


Y = 





iar estimaţia este: 





Din calcule rezultă: 
7 = IP ana = (3: 150+2:500+ 1: 350) = 1,8 ore 
Sp = 0,021 ore 
Intervalul de încredere estimat, pentru o probabilitate de 0,95 este: 
y+ta: s7) 
pap 


Adică rezultă intervalul estimat: 


(1,80 + 1,96 : 0,021) > (1,80 + 0,041) ore 
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Pentru ultima cerință, avem cazul unui test Student de egalitate a mediei 
populaţiei cu o constantă. Ipotezele statistice sunt următoarele: 


Ho: uU = 2 
H:us2 
Valoarea calculată a testului se obține astfel: 
$=2 18-—2 
teaic = —— = a = —9,5 
SAE Sir AOZI 


Pentru o încredere de 0,95, se observă că |tear| > 1,96, adică se respinge 
ipoteza nulă. 


4.3. Sondajul în două sau mai multe trepte 


Sondajul stratificat presupune două etape metodologice, însă doar în una 
dintre acestea se apelează la selecția aleatoare. Există situații când principiul 
aleator de selecţie se poate aplica la mai multe niveluri în cadrul unui plan de 
sondaj mixt. Asemenea situaţii sunt întâlnite în cazul sondajelor realizate în două 
sau mai multe trepte, numărul acestora fiind dat de frecvenţa cu care se apelează la 
principiul selecției aleatoare. În această secțiune, prezentăm câteva aspecte legate 
de construirea unui plan de sondaj în două trepte ce utilizează principiul selecției 
aleatoare simple în ambele etape ale selecției. 


4.3.1. Fundamentarea metodei 


Ideea construirii unui eşantion printr-o selecţie în două etape este strâns 
legată de natura populațiilor studiate. De exemplu, pentru analiza fenomenelor 
economice şi sociale se ia în considerare frecvent organizarea administrativ 
teritorială a unei ţări sau regiuni geografice. Pentru construirea eşantionului se ia în 
calcul împărţirea pe judeţe, oraşe, comune, iar în interiorul fiecărei unităţi 
administrative se pot identifica alte structuri care sunt relevante pentru asigurarea 
reprezentativităţii: cartiere, străzi, clădiri etc. 

Prin organizarea unui sondaj în două sau mai multe trepte, se au în vedere 
următoarele limite ale sondajului aleator simplu (Ardilly, 1994, p. 94): 

— costurile de culegere a datelor, mai ales în cazurile în care eşantionul este 
foarte dispersat în teritoriu; 

— construirea bazei de sondaj, care trebuie să cuprindă toate unităţile populaţiei 
şi să conţină elementele de identificare a fiecărei unităţi în parte. 

Principiul de bază al sondajului în două trepte este structurarea populaţiei în 
grupe mari de unităţi numite unități primare (UP). Fiecare unitate a populaţiei este 
identificată prin apartenenţa la una dintre aceste UP. În consecinţă, baza de sondaj 





ţ 
| 
i 
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este constituită la două niveluri: există o bază de sondaj a UP, iar fiecare UP are o 
bază de sondaj pentru unităţile individuale care o compun, numite şi unități 
secundare (US). De exemplu, într-o anchetă privind activitatea agricolă a 
gospodăriilor, UP pot fi regiuni sau unități administrativ teritoriale, iar ca US se pot 
considera gospodăriile. 

Extragerea eşantionului se realizează în două trepte (a se vedea tabelul 4.2): 

— mai întâi, se extrag aleator, după o procedură cunoscută, UP şi se obţine un 
eşantion de UP (de exemplu, se extrag cele trei UP marcate în tabel). Este 
important de subliniat că obținerea eşantionului presupune construirea unor 
baze de sondaj doar pentru UP extrase deja; 

— din fiecare UP se extrag aleator US, după o procedură care nu depinde de 
prima extragere. US astfel extrase compun eşantionul final (de exemplu, se 
extrag cele 6 US marcate în tabel). Extragerile din fiecare etapă pot fi cu 
probabilități egale sau inegale. Decizia se ia în funcţie de informaţia 
disponibilă cu privire la structura populaţiei pe UP. 


Tabelul 4.2. Principiul selecției în două trepte 









UP Etapa 1 - extragere UP Etapa 2 - extragere US 
0000 0000 0000 
o 0 oo 00 
00000 00000 00000 
oo î oe 
000 | . 000 
00000 00000 00000 
000 000 000 
o o o 
000 
00eo 


00eo0oce 

















Prin acest procedeu de selecţie se elimină inconvenientele prezentate mai 
sus: eşantionul nu mai este atât de dispersat şi nu mai este nevoie de o bază de 
sondaj pentru întreaga populaţie. Metoda poate fi aplicată şi în cazul în care bazele 
de sondaj cu US lipsesc parțial sau total. După extragerea UP, se pot realiza 
cercetări exhaustive în interiorul acestor unităţi (cazul sondajului pe serii) sau se 
pot constitui baze de sondaj doar după ce sunt cunoscute UP extrase. În aceste 
condiţii, costurile anchetei se pot reduce considerabil. 
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Avantajul metodei sondajului în două trepte se poate evidenția în cazul 
anchetelor organizate în gospodării, sondaje care, de regulă, au caracter periodic. În 
aceste condiţii, se extrag UP, care pot rămâne fixe, iar unităţile secundare pot fi 
extrase din nou la fiecare anchetă. De asemenea, se poate fixa şi echipa de 
operatori, care va administra chestionarul în zone restrânse. O importantă reducere 
a costurilor, precum şi o precizie a rezultatelor se asigură şi prin realizarea unor 
baze de sondaj în cadrul acestor grupe primare selectate. Bazele de sondaj astfel 
construite sunt mai facil de administrat şi de actualizat, iar erorile de eșantionare şi 
de observare pot fi identificate şi reduse mult mai uşor. 

Metoda prezintă şi un dezavantaj, numit efect de sondaj (Ardilly, 1994, p. 
96). Este vorba despre efectul redundanţei informaţiei care apare din cauză că 
unităţile din eşantion provin doar din anumite unităţi primare extrase în prima 
treaptă a sondajului. În final, rezultatele sondajului în două trepte sunt mai puţin 
precise decât rezultatele unui sondaj aleator, însă costul şi timpul de realizare sunt 
mult reduse. 

Condiţiile de eficienţă ale sondajului în două trepte impun ca UP să aibă 
următoarele caracteristici (Desabie, 1966, p. 263): 

— volumul lor să nu fie prea mare, deci să existe un număr suficient de mare de 
asemenea unităţi, astfel încât să fie posibilă o extragere aleatoare a acestora 
în prima treaptă; 

— o relativă omogenitate în raport cu variabilele de interes. Dacă nu există 
această omogenitate, împărțirea populaţiei în grupe primare nu este eficientă, 
iar rezultatele nu sunt precise; 

— diferenţele de volum între unităţi să nu fie mari. 

În concluzie, calitatea rezultatelor depinde de numărul de UP extrase în 
cadrul eşantionului, de numărul de US extrase din fiecare UP şi de procedeul de 
extragere din fiecare treaptă. 


4.3.2. Proprietăţile estimatorilor. Precizia rezultatelor 


Pentru evaluarea preciziei rezultatelor sondajului în două trepte, este 
important să se ia în considerare principiul descompunerii varianţei totale a 
variabilei de interes (Y) în două componente determinate de cele două etape ale 
procesului de selecție (caz întâlnit şi la sondajul stratificat). Diferenţa față de 
sondajul stratificat este că, în acest caz, pentru calculul preciziei, contează ambele 
componente ale varianței, atât din interiorul UP, cât și între acestea, pentru că 
selecția aleatoare se realizează la ambele niveluri. 

Notăm cu M numărul de UP şi cu N; numărul de unităţi individuale la 
nivelul fiecărei UP şi cu N numărul total de unități la nivelul populaţiei, iar cu Y 
variabila de interes şi cu X variabila după care se realizează structurarea pe UP. 

La nivelul unei UP, media variabilei de interes este: 








Sondaje mixte 167 
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HU; dy 
JI 2 

M 

Dn, =N=M-N 

ji 

ph 

“M 


unde N este numărul mediu de unități pe UP. 
Similar, se poate construi totalul la nivelul UP: 


N) 
7 = di =ujN 
n 


Dacă se cunoaște totalul, se obține media US la nivelul unei anumite US;: 


T; 
J 


Totalul mediu la nivelul unei UP este dat de relaţia: 


M M Ni _ 

1 1 Y 

nina 
J=1 j=1 i=1 


iar varianţa totală a variabilei de interes este: 


MAN) 


o? = > Gu pf 


ja iza 
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Pentru procesul de estimare se iau în considerare următoarele varianţe ce se 


obțin pentru structurarea populaţiei pe UP şi US: 
— componenta wifhin sau varianţa valorilor la nivel de US din interiorul tuturor 


UP (02): 
M 
DX 


_& 


unde 


N) 

2 

= 2 bou Za uj) 
i=1 


— componenta between se poate scrie în două moduri, în funcţie de totalurile şi 
de mediile la nivel de UP: 


1 M 
ci = db) 


La nivelul unui eşantion de volum n, notăm cu m numărul de UP selectate, 
iar cu n; numărul de US selectate din UP;. Rezultă: 





m 
N = > nj 
E 
Media US selectate de la nivelul unei UP este: 
nj 
=>. 
Y)j n, 4 Yij 
i=1 
iar varianțele estimate sunt: 
nj 
1 2 
"2 a, 
Sa ; 
j 1 2 3) 
i=1 
1 m 
2 — 12 
si, =—)s 
W m ) 
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m îi 
1 m 
Ă = 119) 
sp = Ap: =) 


Totalul la nivelul eşantionului extras dintr-o UP este de forma: 


nj 
_ Aj 
7 = 3 td zu 
| 
= 
Media eşantionului se obține ca o medie a mediilor de la nivelul sub- 
eşantioanelor extrase din fiecare UP: 
m n 
i=1 
a. Estimatori ai totalului şi mediei 
In principiu, construirea unui estimator pentru un anumit parametru 8 trebuie 


j=1 
să ţină cont de cele două etape ale selecției aleatoare. Așadar, media estimatorului 
se obţine astfel: 


al 
3 
an 


E(6) = EA[E2(0)] 


unde E, şi E2 sunt operatorii medie pentru fiecare etapă a selecţiei, adică pentru 

toate UP ce pot fi extrase în prima treaptă și pentru toate US ce pot fi selecționate 

în a doua treaptă, în condiţiile în care au fost selecționate deja un număr de UP. 
Similar, varianţa presupune proprietatea: 


v(8) = E(6— 8) = EE2(6 —0) = v.[E2(6)] + £.[v=(6)] 


Un estimator nedeplasat pentru totalul la nivel de UP 


NJ 
Tj = dy = Wj- N 
IZ1 


este construit pe baza estimatorului mediei la nivel de UP: 


î; = Aj Nj 
nj 
„N 
zau 
] * 
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unde Y;; sunt variabile aleatoare de selecţie construite prin extragerea aleatoare a 
US din UP;. Estimatorul totalului la nivelul populaţiei este: 


m nj 
MN MN, 
a e de 2 
"n m d nj 
jZ ja Jia 


iar estimaţia sa are relația: 


paint tăia 


sau 
T=N-7 


Un estimator nedeplasat pentru media populaţiei este: 


== at o Nm DR j di LS, 


Aplicând operatorul medie relaţiei de mai sus, se obţine ușor proprietatea de 
nedeplasare: 


î 


E(f) = 


Se poate demonstra că varianţa estimatorului totalului ? este: 
(0) = Ma = pp) E + - NAQ.- pe 
sau 


Vo) = M2 (1-4) Zhao n Du i 


In relaţia de mai sus apar două ponderi sau două fracţii de sondaj specifice 
celor două etape ale eșantionării: 


z|3 


fu = 


cu privire la UP și prima treaptă de selecție; 
n; 
= 


17] 
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cu privire la US. 
O estimaţie a varianţei estimatorului pentru total este de forma: 


se (1) za ba 1 + (a-i 


m m 
unde 
nj 
1 2 
12 _ i 
sp? = 2 ou 3) 
J ZI 
Un estimator nedeplasat al varianţei mediei de selecţie se obţine prin relaţia 
1 
V(A) = 2 V( 
Analog, 
] 
să = N2s? 
Observaţii 
1. Dacă fracția de sondaj în extragerea din treapta a doua este constantă, 
adică i = fa, iar UP au același volum N; = N = E, deci nj = N: f, = î, atunci 
au loc relaţiile: 
T=N-y 
m 
1—f 1 Ze Afae I 
2 2 1 = = 2 12 
i- pomi 15, 
a iezi A 2) mii mii 
j=1 j=1 
nj 
1 
Ma 
ji -2 bu y;) 


172 Sondajul statistic 











1 — 1 
si = z0- Ș) + mă = 


e 


Me 


2. Varianţa estimatorului obținut prin metoda dada în două trepte este 
mai mare decât cea obținută cu ajutorul sondajului aleator simplu. Raportul dintre 
cele două varianţe se numeşte efect de sondaj (desien effect-deff): 


V(4) 
Vas(f) 
unde Vias([i) este varianţa estimatorului mediei pentru cazul sondajului aleator 
simplu (SAS). 

Efectul de sondaj se poate măsura cu ajutorul unui coeficient ce poartă 
numele de coeficient de corelaţie intra-UP notat cu p. Dacă UP au același volum 





deff = 


N, atunci 0,2 = 7 şi se poate arăta că: 


E: Ge „d 
Po o2 N 
În aceste condiții, efectul de sondaj se obţine astfel: 


deff =1+ p(n -—1) 

Ca o concluzie, pentru a diminua eroarea de estimare și a obține un rezultat 
apropiat de cel al sondajului aleator simplu, trebuie diminuată varianţa inter-UP 
sau să crească componenta intra-UP. Cu alte cuvinte, gradul de omogenitate al UP 
nu ar trebui să fie semnificativ diferit de cel al populaţiei totale. 

3. Dacă se dispune de o valoare a lui p, atunci se poate calcula nivelul de 
precizie a unui sondaj în două trepte cu ajutorul relaţiei: 


2 





VC) = N2 — (+ p(-D) 





o 
VA = at pi D) 

În relația de mai sus, m : îi reprezintă volumul eşantionului extras cu ajutorul 
metodei sondajului în două trepte. 

4. În condiţiile în care se cunosc p şi elementele de cost ale sondajului, adică 
costul total (C) şi costurile unitare la nivel de UP (c.) şi de US (c2), se pot estima 
efectivele m și î, pentru o varianță V(A) minimă, potrivit relaţiilor de mai jos 
(Ardilly, 1994, p. 123): 
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C- + C1C2 i 


C=cum+ocom-f 


Dacă se cunoaşte numărul de unităţi ce trebuie extras dintr-o UP, eroarea 
maxim admisibilă cu care se estimează parametrul medie și anumite limite pentru 
varianţele inter-U P, atunci numărul de UP se poate obține astfel: 


sg 02 
An SE? 
Exemplu 
Considerăm populaţia fermelor producătoare de fructe dintr-o țară 
structurate în 40 de grupe (M = 40), după regiunea administrativă, și se cunoaște că 
fiecare regiune conține 100 de ferme (N = 4000). Pentru a studia nivelul producţiei 
de fructe (tone/ha), se realizează un sondaj în două trepte şi se extrag aleator 5 
regiuni (m = 5), iar apoi din fiecare regiune se extrag aleator simplu câte 20 de 


ferme (n = 100). Rezultatele obținute la nivel de eșantion sunt prezentate mai jos: 


Pda e had 8] 
Pa Pe Pra paie 








Se cere să se estimeze punctual şi prin interval de încredere nivelul mediu al 
producţiei agricole pe o firmă la nivelul întregii populaţii, cu o probabilitate de 0,95. 


Se ştie că: 
_ N 4000 
N za a 00 
__ n 100 
a E = 20 
m 
fi = 37 = 2 > 0.125 
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e N 100” 
Nivelul mediu al producţiei de fructe pe o fermă la nivel de eșantion este: 
y = E Yj = 4,5 tone la ha 


Această valoare reprezintă estimaţia nedeplasată a mediei la nivelul 
populaţiei totale. 
Pentru o probabilitate de 0,95, intervalul de încredere este de forma: 








(3 + 196.2) 
unde 
Lică 7 
1 — fi 1 2 1 fa 1 
2 — - = 12 
sa = m 2-3) ti fi d 
ji j=i 
di NO a 1,2 + 0,125. 1792. 1. 6,34 = 0.053 
Sp Eat 00 5 


Sp = 0,23 tone la ha 
Intervalul de încredere estimat este de forma: 
(3 £ 1,96: sp) > (4,5 + 1,96: 0,23) 3 (4,5 + 0,45) tone la ha 


b. Metode de ameliorare a preciziei sondajului în două sau mai multe 
trepte 


multe trepte. 

Stratificarea unităţilor primare 

Stratificarea introduce, de obicei, un câştig de precizie. Această procedură se 
poate aplica şi în cazul sondajului în două trepte. Unităţile primare pot fi împărţite 
pe straturi după un anumit criteriu determinant pentru tema anchetei. De exemplu, 
dacă se consideră un sondaj despre nivelul investiţiilor în România, unităţile 
primare sunt reprezentate de judeţele României, care sunt stratificate pe regiuni de 
dezvoltare economică. În interiorul fiecărei unități primare se găsesc baze de 
sondaj cu firmele din respectivul judeţ (existente la Camera de Comerţ şi Industrie 
sau la Direcţia Finanţelor Publice), care reprezintă unităţile secundare. O unitate 
primară de dimensiuni mari, cum este municipiul Bucureşti, trebuie considerată 
separat un strat. Recomandabil este ca straturile să fie de dimensiuni apropiate, atât 
ca număr de unități primare, cât şi ca număr de unităţi secundare. 
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Alocarea unităților primare în eşantion, precum şi extragerea unităţilor 
secundare prezintă probleme practice complexe. Pentru simplificare, se poate 
aplica un sondaj stratificat cu alocare proporţională. Dacă informaţiile disponibile 
permit, se poate realiza şi o alocare optimală, în funcţie de cost şi de varianţa de la 
nivelul fiecărui strat. De exemplu, dacă varianţa şi costul unitar variază de la un 
strat la altul, este recomandabil ca fracţia de sondaj să fie proporţională cu varianţa 
din acel strat şi invers proporţională cu costul unitar din stratul respectiv. 


Extragerea sistematică a unităţilor primare 
Printr-o extragere sistematică se poate obţine un plus de precizie datorită 
modului de organizare a unităţilor care vor intra în eșantion. 


Stratificarea unităţilor secundare în cadrul fiecărei unități primare 

Precizia unui sondaj în două trepte poate fi ameliorată şi prin realizarea unui 
sondaj stratificat în treapta a doua a sondajului. După ce au fost extrase unitățile 
primare, extragerea unităților secundare se realizează printr-un procedeu specific 
sondajului stratificat. Baza de sondaj a fiecărei unităţi primare este structurată după 
o variabilă cunoscută. Extragerile din fiecare unitate primară sunt independente şi 
respectă condiţiile sondajului stratificat. 


4.4. Sondajul pe serii (cluster) 

În practică, există situaţii în care unităţile populaţiei sunt organizate în mod 
natural în grupuri sau în unități primare (UP) compacte numite serii sau clustere. 
De exemplu, vorbim despre persoanele dintr-o gospodărie sau dintr-un bloc de 
locuinţe; gospodăriile dintr-o zonă a unui oraș sau de pe o stradă; studenţii dintr-o 
grupă etc. O serie (cluster) reprezintă un număr de unităţi individuale din populație 
cu proprietatea că fiecare unitate aparţine unei singure serii. 


4.4.1. Justificarea metodei 


În principiu, acest tip de sondaj presupune ca unitatea de eșantionare să fie 
una complexă, adică o unitate formată din mai multe unități individuale ale 
populaţiei. Ca urmare, sondajul pe serii poate fi tratat ca un caz particular al 
sondajului în două trepte. Seriile identificate la nivelul populaţiei joacă rolul de UP 
şi reprezintă unitățile de eșantionare. Această metodă presupune ca în a doua 
treaptă a sondajului să nu se mai realizeze o extragere aleatoare de unități 
secundare (US), ci să se efectueze o cercetare exhaustivă a unităţilor individuale 
din fiecare UP extrasă în prima treaptă (vezi tabelul 4.3). 

De exemplu, UP sau seriile pot fi gospodării de persoane, clădiri cu mai 
multe gospodării sau străzi cu mai multe clădiri. După ce au fost extrase în prima 
treaptă un număr de gospodării sau de clădiri, eşantionul supus observării este 
reprezentat de toate persoanele care compun aceste UP. 
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Avantajele metodei sunt în primul rând de ordin economic şi practic pentru 
că se reduc costurile de observare şi se simplifică procedura de constituire a bazei 
de sondaj. În plus, se reduc non-răspunsurile şi erorile de acoperire cauzate de 
incompletitudinea bazei de sondaj. 

Inconvenientul metodei este dat de pierderea de precizie, efectul redundanţei 
informaţiei la nivel de serii putând fi unul ridicat. Pentru a reduce acest efect, 
seriile trebuie să îndeplinească următoarele caracteristici (Ardilly, 1994, p. 116): 

— grupele să fie cât mai asemănătoare ca mărime şi structură; 

— grupele să fie eterogene în raport cu variabila de interes; 

— populaţia să fie structurată într-un număr suficient de mare de serii de unităţi 
individuale, ceea ce presupune ca volumul unei grupe să nu fie mare; 

— în cadrul eşantionului să se extragă un număr mare de serii. 


Tabelul 4.3. Principiul selecției pe serii 





Etragere UP şi a 
eşantionului 
0000 
oo 
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4.4.2. Calitatea estimatorilor și a rezultatelor 


Considerăm mai întâi cazul unui sondaj în care seriile au același volum. 
Adică la nivelul populaţiei există M serii sau UP cu acelaşi volum: 


De asemenea, se consideră că se extrag din populaţie m serii de volum egal. 

În comparaţie cu sondajul în două trepte, sondajul pe serii poate fi uşor 
comparat cu sondajul aleator simplu, doar că vorbim despre extragerea de UP şi nu 
de unităţi individuale. 
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În acest caz, avem relațiile: 
— media şi totalul la nivel de cluster: 


— media la nivelul populaţiei: 


unde 
—  estimatorul mediei: 


m 
A 


i=1 j= 


Buz 


AN 


> 


unde 
n=m-N 


şi estimatorul este identic cu cel din cazul sondajului aleator simplu. 
La nivel de eşantion, estimaţia mediei este: 


N m 
=. 
Ia Yij 


—  varianţa estimatorului mediei: 


M 
1 ] 
V(A) = (1 - 2) n UTA =) 


1 
=> 
— 
4 
=> 


unde 


Si 
JI 
= 
az 
us 
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estimația varianţei estimatorului mediei: 


11 i 
să a (1-2) ze DA =) 


unde 


ze E 
Ţ = — 
m 


iar T este estimaţia punctuală a lui 7, respectiv T; estimaţia lui 7;. 


estimaţia varianţei estimatorului totalului: 


De uaZ 
ss = M“- sa 
Observaţii 
în comparaţie cu sondajul în două trepte, sondajul pe serii reține în relaţia 
varianţei estimatorului mediei doar componenta varianţei între UP, ceea ce 
înseamnă că este mai precis; 


efectul de sondaj deff = aaa 
sas 


decât cel aleator simplu dacă varianţa dintre grupe nu este mare, adică dacă 
seriile sunt eterogene și varianța din interiorul lor preia o pondere mare din 
varianţa totală. 

dacă seriile sau UP nu au același volum, formulele de mai sus se modifică cu 
ponderile corespunzătoare, după formulele de la sondajul în două trepte. 





ne arată că sondajul pe serii este mai precis 


Exemplu 
Pentru a estima nivelul mediu al producţiei de legume al unei gospodării 


(kg), se realizează un sondaj la nivelul celor 2000 de gospodării ale unei comune ce 
sunt organizate pe 50 de zone agricole a câte 40 de gospodării fiecare. În acest 
scop, se realizează un sondaj pe serii. Se extrag aleator 8 regiuni și se culeg date de 
la toate gospodăriile care formează astfel eşantionul. 


Rezultatele obţinute la nivelul eșantionului, privind producţia totală de 


legume pentru gospodăriile din cele 8 regiuni extrase, sunt prezentate în tabelul de 














mai Jos: 
1 2 3 4 | 5 | 6 7 8 
N; | 40 40 40 40 | 40 | 40 40 40 
7, | 12000 | 12300 | 13000 | 12500 | 12200 | 12100 | 12800 | 11500 





Se cere să se estimeze punctual și prin interval de încredere nivelul mediu al 


producției de legume pe o gospodărie la nivelul întregii populaţii, cu o probabilitate 
de 0,95. 


i 
| 
i 
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Se ştie că: 
Ai ee az 2000. 36 
] M 50 
m=8 
m 8 
În = 37 = 3 > 0.16 


n =m-N = 8.40 = 320 


Nivelul mediu al producţiei de fructe pe o fermă la nivel de eşantion este: 


Pa T 1 1 
Ș == 1501, = 2 98400 = 307,5 kg 


Această valoare reprezintă estimaţia nedeplasată a mediei la nivelul 
populaţiei totale. 


Pentru o probabilitate de 0,95, intervalul de încredere este de forma: 
(3 + 1,96-s9) 


unde 


iar 


deci 


98400 





= 12300 kg 


1 
2=(1——]:—. 0000 = 2 
Sâ fi ) 3 1560000 3400 


sp = 152,97 kg 


Intervalul de încredere estimat este de forma: 


(3 + 196 sa) > (307,5 + 1,96: 152,97) 3 (307,5 + 299,82) kg 
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4.5. Exerciţii 


1. Se consideră o populaţie de volum N = 12, iar unităţile acesteia sunt 
organizate pe 4 straturi. Pentru o variabilă de interes, valorile pe cele 4 straturi se 
repartizează după cum urmează: 

12,4); 

(13,54 

(1,244); 

(34,5). 

Se cere: 

— să se calculeze media şi varianţa variabilei de interes pe fiecare strat; 

- să se verifice proprietățile mediei şi ale varianţei: media mediilor de strat 
este media populaţiei totale; varianţa totală se descompune în varianţa între 
straturi și intra-straturi. 


2. Pentru datele de la problema 1 se consideră extragerea fără revenire a unui 
eşantion de 4 unităţi, câte una din fiecare strat. Valorile la nivelul eșantionului sunt: 
(2,3,4,5). 

Se cere: 

— să se estimeze punctual și prin interval de încredere media populaţiei cu 
ajutorul eșantionului extras; 

— să se calculeze eroarea efectivă de estimare şi să se compare cu eroarea 
standard estimată. 


3. La nivelul unui oraş ce conţine 10000 de gospodării se organizează un 
sondaj stratificat pentru a estima proporţia celor care deţin o locuinţă în proprietate 
privată. Se consideră că gospodăriile sunt structurate pe 4 straturi, care reprezintă 
cartierele orașului. 

În urma eșantionării a 500 de gospodării, rezultă următoarele informaţii 
privind structura populaţiei totale, structura eșantionului şi ponderea celor care 
deţin locuinţa în proprietate: 





























|__ Cartier 1 | Cartier2 | Cartier3 | Cartier4 
N | 20% | 25% 30% 25% 
n | 125 | 100 150 125 
Ph | 0,15 | 0,25 035 | 0,20 
Se cere: 


— să se estimeze punctual ponderea gospodăriilor care deţin în proprietate 
locuinţa. Ce proprietate are această estimaţie? 

— să se estimeze prin interval de încredere, cu o probabilitate de 0,95, ponderea 
gospodăriilor care dețin în proprietate locuinţa. 





i 
ț 
i 
| 
| 
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4. La nivelul unui oraş cu 10000 de gospodării structurate în 4 cartiere se 
realizează un sondaj stratificat proporțional, de volum n = 400, pentru a estima 
nivelul mediu al venitului lunar pe gospodărie (euro). Rezultatele anchetei la nivel 
de eşantion, împreună cu structura populaţiei pe cartiere sunt prezentate mai jos: 














| | Cartieri | Cartier2 | Cartier 3 | Cartier4 
N, | 2000 3000 2500 2500 
CE 800 700 650 750 

|__s, | 100 75 |. 60 80 











Se cere: 

— să se estimeze punctual nivelul mediu al venitului unei gospodării. Care este 
relaţia între această estimaţie şi venitul mediu la nivel de eșantion? 

— să se estimeze prin interval de încredere nivelul mediu al venitului unei 
gospodării, cu o probabilitate de 0,95; 

— să se testeze dacă venitul mediu al unei gospodării nu diferă semnificativ de 
700 de euro, admițând un risc de 5%. 


5. Se cunoaşte structura studenților unei universităţi pe 3 categorii de 
facultăţi (socio-umane, ştiinţe, vocaţionale) şi se cunoaște, din studii anterioare, 
gradul de omogenitate al studenţilor de la fiecare facultate după gradul de 
participare la cursuri (numărul de prezenţe la curs pe semestru pentru un student, 
cu valori între 0 şi 14). Informaţiile privind populaţia sunt prezentate în tabelul de 


mai jos: 
[Gates | Cate? | Catez 3 | 
o) 2 3 2 












Se dorește să se realizeze un sondaj stratificat de volum n = 400, pentru a 
studia gradul de participare a studenţilor la cursuri în anul curent. Se cere să se 
construiască structura eşantionului pentru o alocare proporțională şi una optimală. 
Să se compare rezultatele. 


6. Într-un sondaj statistic se dorește să se estimeze consumul mediu de gaze 
naturale pe lună al unei gospodării dintr-un cartier (N = 5000). Se consideră un 
plan de sondaj care ia în calcul organizarea gospodăriilor pe blocuri de 
apartamente. Într-o primă treaptă se extrag aleator 7 blocuri, iar în treapta a doua se 
includ în eşantion toate gospodăriile din aceste blocuri. La nivelul eşantionului s-au 
obținut rezultatele: 





1 2 3 4 5 | 6 | 7 
Nr. gospod. 16 25 15 30 20 | 24 20 
Consum total 200 320 | 190 400 | 250 | 300 | 240 
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Se cere: 

— să se estimeze punctual valoarea totală a consumului și consumul mediu pe 
gospodărie la nivelul întregii populații; 

— să se estimeze prin interval de încredere consumul total și nivelul mediu al 
consumului. 


7. Pentru a estima nivelul mediu al venitului unei gospodării (euro) la nivelul 
unui oraș, se realizează un sondaj în două trepte. În prima treaptă se identifică un 
număr de 125 de străzi, cu un număr aproximativ egal de gospodării (100) din care 
se extrag aleator 10. În treapta a doua se extrag aleator 80 de gospodării de pe 
fiecare stradă. 

Rezultatele la nivel de eșantion sunt prezentate mai jos: 





NE 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 
7 |.1000 | 1250 | 1500 | 900 | 1400 | 950 | 1250 | 1100 | 1200 ] 900 
sj | 100 | 110 | 160 | 100 | 120 | 80 | 95 | 110 ] 100 | 70 











Se cere să se estimeze punctual și prin interval de încredere nivelul mediu al 
venitului unei gospodării, cu o încredere de 0,95. 


SN 


Capitolul 5 


UTILIZAREA UNEI INFORMAŢII 
SUPLIMENTARE. AMELIORAREA CALITĂȚII 
ESTIMATORILOR 


În realizarea sondajelor statistice, un rol important îl deţine informația 
suplimentară cu privire la populaţia analizată. Dacă se dispune de o asemenea 
informaţie sub forma unei variabile puternic corelate cu variabila de interes, se pot 
construi planuri de sondaj mixte care pot îmbunătăţi eficiența sondajului fie prin 
reducerea costurilor, fie prin ridicarea nivelului de precizie. De asemenea, 
informaţia suplimentară poate fi utilizată în etapa de estimare pentru a îmbunătăţi 
eficienţa estimatorilor specifici metodei de sondaj utilizate. 

Sondajele aleatoare și mixte permit ca, în faza finală, după ce au fost culese 
datele statistice, să se intervină asupra acestora în sensul îmbunătăţirii calităţii 
estimaţiilor obţinute. O asemenea intervenţie presupune, de regulă, o ajustare cu 
ajutorul unei informaţii suplimentare care se utilizează a posteriori şi care conduce 
la ameliorarea calităţii estimatorilor utilizați în inferenţa statistică. Calitatea unui 
estimator se poate îmbunătăți fie prin reducerea varianţei acestuia, fie a deplasării, 
dacă este cazul. 
estimatorilor prin reducerea varianţei. În prima parte prezentăm principiul 
fundamental care stă la baza acestei proceduri. În următoarele trei secțiuni sunt 
prezentaţi estimatorii obţinuţi prin post-stratificare, raport și regresie. 


5.1. Principiul ameliorării estimatorilor prin reducerea varianței 

Estimarea parametrilor unei populaţii la nivelul unui sondaj presupune 
utilizarea setului de date obţinut cu ajutorul eșantionului extras. Pentru o variabilă 
de interes Y, acest eşantion este un set de date de forma: 
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(Yo Ya «0 Yn) 


Dacă se dispune de o informaţie suplimentară printr-o variabilă X strâns 
corelată cu variabila Y, atunci pentru fiecare unitate din eșantion se pot utiliza 
diverse măsuri obţinute cu ajutorul unor instrumente statistice ce au la bază 
legătura dintre cele două variabile. Obiectivul final al acestui procedeu este acela 
de a obţine un estimator pentru un parametru al variabilei de interes Y care să aibă 
o varianță mai redusă decât a estimatorului convenţional (care nu ia în considerare 
variabila suplimentară X). 

În general, informaţia suplimentară este disponibilă pentru toţi indivizii 
populaţiei, condiţie esenţială mai ales când este vorba despre construirea unui 
sondaj mixt. Practica arată însă că această informaţie este frecvent disponibilă sub 
forma unor indicatori (medie, varianță, proporţie) şi deci nu poate fi utilizată pentru 
a construi un plan de sondaj. În asemenea situaţii, informaţia poate fi utilă pentru a 
construi un alt estimator, după ce s-a realizat un sondaj aleator simplu. 

Schematic, prezentăm procedeul de bază al ameliorării calității estimatorilor 
prin reducerea varianţei cu ajutorul etapelor de mai jos (Ardilly, 1994): 
se consideră o variabilă de interes Y la nivelul unei populaţii de referinţă P, 
care este studiată la nivelul unui sondaj s; 

— după efectuarea sondajului, se determină un estimator pentru un parametru 
anume al distribuţiei populaţiei după variabila Y, folosind o metodă clasică 
cunoscută (de exemplu, pentru parametrul medie se foloseşte estimatorul 
media de selecţie); 

— se stabileşte o variabilă suplimentară X, puternic corelată cu variabila de 
interes Y; variabila X este cunoscută la nivelul întregii populaţii, adică este 
cunoscută distribuţia acesteia (sunt cunoscuţi parametrii distribuţiei); 
deținerea unei informaţii agregate nu presupune și cunoașterea valorilor 
variabilei la nivelul tuturor unităţilor individuale; 

- la nivelul eşantionului, se determină un estimator cu varianță nulă al 
parametrului cunoscut al variabilei suplimentare X (de exemplu, dacă 
parametrul de estimat pentru variabila Y este media, atunci pentru variabila 
X se construieşte un estimator tot pentru parametrul medie, numai că în acest 
caz parametrul este cunoscut, iar varianţa estimatorului va fi nulă); 

— se acţionează asupra estimatorului iniţial obţinut pentru variabila Y în sensul 
modificării ponderilor care apar în expresia acestuia (pe baza ponderilor care 
apar în expresia estimatorului obținut pentru variabila X); 

— se obţine un nou estimator care pentru variabila X îndeplineşte proprietatea 
cerută (varianţă nulă), iar pentru variabila Y este un estimator mai bun, adică 
are o varianţă mai mică. 


| 
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Observaţie 

Ameliorarea  estimatorilor prin această schemă determină reducerea 
varianţei, iar instrumentul de bază îl reprezintă modificarea ponderilor care apar în 
expresia estimatorului variabilei de interes la nivelul unui eşantion deja extras. 
Modificările care sunt realizate prin această metodă nu se realizează asupra 
eşantionului, adică asupra datelor deja culese. 


5.2. Post-stratificarea 


Prin post-stratificare se urmăreşte să se folosească proprietăţile şi precizia 
unui sondaj stratificat care să fie aplicate unui sondaj aleator simplu. În acest sens, 
se utilizează o variabilă suplimentară puternic corelată cu variabila de interes 
studiată. Conform principiului eficienţei statistice, rezultatele acestei metode 
trebuie analizate din mai multe puncte de vedere: precizie, cost, simplitate, timp de 
realizare a procedeului. 

Să presupunem că am extras un eşantion de volum n prin efectuarea unui 
sondaj aleator simplu. Având la dispoziţie o variabilă suplimentară X, cunoscută la 
nivelul populaţiei de referință, se face o stratificare a eşantionului extras în H 
straturi de volum np. Cele H straturi poartă numele de post-straturi. 


E : Nh , 
De asemenea, presupunem că sunt cunoscute ponderile E la nivelul 


colectivităţii totale, ponderi care dau stratificarea populaţiei de referință după 
variabila X. Aceste ponderi îndeplinesc proprietatea: 


N = DN 
h=1 


Estimatorul mediei, obţinut pe baza informaţiei suplimentare X, poartă 
numele de estimator prin post-stratificare şi are relaţia: 


N 
Ș h a 
Ypost Ei N > 
h=1 
unde y, reprezintă mediile de selecţie de la nivelul fiecărui strat. 
Aplicat variabilei X, acest estimator devine: 


H 

„> pă 

— N N 

adică îndeplineşte proprietatea cerută de principiul menţionat în capitolul 
introductiv. 


Estimatorul obținut prin post-stratificare este, prin relație, identic cu cel 
obţinut într-un sondaj stratificat, însă diferenţa majoră este următoarea: 


H 


A» 


Nn 
N 


> 
4 
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— în cazul sondajului stratificat, ponderile = de la nivelul eşantionului extras 


sunt stabilite prin metoda de eşantionare, proporţional sau nu; 

— în cazul post-stratificării, eşantionul este obţinut aleator (după o metodă 
oarecare), iar volumul n, este, de asemenea, aleator, el nu este stabilit în 
prealabil, ci doar are proprietatea: 


H 


men 


h=1 


Se observă că prin post-stratificare am modificat ponderile estimatorului din 
sondajul iniţial. Inainte de a realiza post-stratificarea, estimatorul parametrului 
medie este media de selecţie: 


iar ponderea sa este 1/n. 
După aplicarea metodei de ameliorare, expresia estimatorului este: 


Ypost = > er 


=1 i€sp 
iar ponderea sa are expresia 
N 1 
N np 
Notând prin w; ponderea care apare în expresia unui estimator, putem scrie: 


1 
W; = — = constant 
n 


pentru estimatorul obținut în mod clasic; 


pentru estimatorul obținut prin post-stratificare care depinde de np. 


5.2.1. Proprietățile estimatorului 


Relaţia estimatorului Si prin post-stratificare este următoarea: 


a E N 
fm tb = bl 


=1 1ESn 
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Verificăm proprietăţile pentru acest estimator. 


a. Nedeplasarea estimatorului 
Proprietatea de nedeplasare este verificată prin relaţia: 


H H H 


= Ni a N = ha TA 
E(Paose) = E Di E AEO) i m Y 
R=ă h=1 Rl 


Din rezultatul de mai sus rezultă că estimatorul obţinut prin post-stratificare 
este nedeplasat, adică aplicarea acestei metode de redresare nu afectează 
proprietatea de nedeplasare a estimatorului iniţial. 

b. Varianţa estimatorului 

Proprietatea fundamentală a redresării este obţinerea unui estimator care are 
o varianţă mai mică decât a estimatorului determinat prin modelul iniţial. 

Varianţa estimatorului obținut prin post-stratificare se determină doar pe 
baza varianţei de la nivelul fiecărui substrat al eşantionului, adică componenta 
intra-strat. Deoarece estimatorul depinde de n, care este o variabilă aleatoare şi 
care apare la numitor, determinarea varianţei acestuia este mai complexă. 

În calcule se folosește o dezvoltare în serie aproximată până la gradul doi a 


„1 J , j : , . 
raportului Pepi pentru care este necesar să se aplice media. Varianţa estimatorului 
h 


are la bază relaţia: 


= N = N? 
= ha h a 
(freze) = V | esa|= d VE 

h=i h=1 


Deoarece Y, depinde de ny, care este o variabilă aleatoare, atunci are loc 
relația: 


de unde rezultă 
 N2 1 1 N 

v(Y = E od) A 2 

( ast) LN? np h N h 


unde 7 reprezintă varianţele de la nivelul fiecărui strat. 
In relația de mai sus ne interesează media raportului Za Pentru a calcula 
h 


această medie vom folosi o dezvoltare în serie plecând de la relaţia: 
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Rp Ph — Ph 
na = En = na 3 PP = Pa + Pa) > nb (1+ pe ) 


adică 


1 1 1 


Tin nb (1 + Ph Bu În) 
h 


unde P, este estimatorul lui pp. 
Dezvoltând în serie şi aproximând pentru primii doi termeni, rezultă: 


E seal ae Pi e, (a E), 
Th i nPy PR Pi 
Aplicând media relaţiei de mai sus, obţinem: 
1 1 Ph — Ph 1 
E (—) = —|1 g (Po | Ei 1 a 
Th nPp ( Ș Pa O nPy + pe (Pr) 


(== 1 N-—n1l1N—Np adi NAN 
IA n nP N h] nN, n2 N N 





n nP, 


unde 
Na 
Py = — 
RON 


Inlocuind în relaţia varianţei şi reducând termenii, obţinem expresia finală a 
varianţei estimatorului prin post-stratificare: 
H 
a 
RZI 


H 
(Poe ):= —, ao 
h=1 








unde 





H 
Lia 2 

N Op 
h=1 


reprezintă varianţa estimatorului unei medii în sondajul stratificat proporţional, iar 
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este un factor care măreşte varianța faţă de cazul stratificării proporţionale. Se 
observă că acest termen este neglijabil pentru sondaje de volum mare. 

Pentru calculul intervalelor de încredere, la nivelul unui eșantion, se 
utilizează următoarea estimaţie a Sie estimatorului: 





4: sa 
Pose 


2 15 sa ds DRE NA ş;2 


unde s;2 sunt estimaţiile varianţelor straturilor, calculate la nivel de eșantion. 


Observaţie 

Deşi precizia estimatorului obţinut în urma redresării este cu puţin mai 
scăzută decât în cazul stratificării apriori, totuşi se realizează un câştig de precizie 
faţă de sondajul aleator simplu. Metoda de redresare prin post-stratificare are 
avantajul că informaţia suplimentară nu trebuie cunoscută la nivelul fiecărei unităţi 
a colectivităţi, ci trebuie cunoscute doar valorile globale din fiecare strat N]. Este 
evident că în această situaţie costul anchetei se reduce. 

Din această observaţie rezultă imediat faptul că este preferabilă post- 
stratificarea în cazul în care dorim să diminuăm costul unei anchete, dacă ar fi să ne 
raportăm la un sondaj stratificat, iar dacă ar fi să ne raportăm la un sondaj aleator 
simplu, câştigul adus de post-stratificare este evident în orice caz. 


5.2.2. Limitele și eficiența metodei 
Metoda se poate aplica doar atunci când se cunosc, pe baza variabilei 
ine „În i i ş 
auxiliare X, ponderile Sp Dacă aceste ponderi nu se cunosc, metoda nu se mai 


poate aplica. 
Post-stratificarea devine ineficientă când post-straturile sunt prea numeroase. 


o Ca > aa Ah 
In practică, se recomandă ca pri 10%. 


Deoarece n, este variabilă aleatoare, apare problema când ny ia valoarea 
egală cu unu, caz în care nu se poate estima varianța 07. În cazul în care n, ia 
valoarea unu, se poate face o corecție prin înlăturarea unităţii care apare în acel 
substrat. 

În concluzie, metoda de redresare prin post-stratificare conduce la un 
estimator care, din punctul de vedere al eficienţei statistice, este mai bun: pe de o 
parte, dacă ne raportăm la un sondaj aleator simplu, estimatorul prin post- 
stratificare are o varianță mai mică, adică este eficient, iar dacă ne raportăm la un 
sondaj stratificat, metoda ne oferă un estimator cu o varianță puţin mai mare, 
cantitate neglijabilă pentru eşantioane mari, însă implică costuri substanțial reduse. 

Limitele de eficienţă ale unui sondaj aleator pot fi îndepărtate doar parțial şi 
în anumite condiţii prin organizarea sondajului stratificat sau a sondajului în mai 
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multe trepte. Prin utilizarea unei informaţii suplimentare se poate îmbunătăţi nu 
numai precizia estimatorilor, ci şi alte elemente ale eficienţei unui sondaj, cum ar fi 
costul, timpul de realizare, dificultăţile practice, posibilitatea de a atinge 
obiectivele. 

Prin post-stratificare se poate răspunde următoarelor limite ale unui sondaj 
organizat de manieră clasică: aleator, stratificat sau în mai multe trepte: 

1. Riscul distorsiunilor de eşantionare (supra-reprezentarea sau sub- 
reprezentarea unor anumite categorii de unităţi din populaţie), care poate conduce 
la o precizie scăzută a rezultatelor. Această problemă este rezolvată de sondajul 
stratificat, însă în unele cazuri un astfel de sondaj nu se poate aplica. 

2. Cunoașterea variabilei suplimentare la nivelul întregii populaţii, pentru a 
realiza apartenenţa fiecărei unităţi individuale la un strat. Atât din punct de vedere 
practic (variabila X nu este cuprinsă în baza de sondaj sau variațiile valorilor sale 
sunt prea mari), cât şi economic (este costisitor şi dificil de sortat baza de sondaj în 
funcţie de variabila suplimentară), această condiţie poate fi o restricţie deosebită. 

Prin post-stratificare se pot corecta distorsiunile de eşantionare, iar precizia 
rezultatelor obţinute este cu puţin inferioară sondajului stratificat, însă costurile 
sunt mult mai reduse. Post-stratificarea nu impune decât cunoaşterea ponderilor de 
la nivelul fiecărui strat, condiţie mult mai facil de îndeplinit decât cunoaşterea 
variabilei la nivelul întregii populaţii. 

3. Apariţia non-răspunsurilor, fie totale, fie parţiale. Aceste erori pot fi 
corectate prin supradimensionarea eşantionului, prin revizitarea unităţilor care 
lipsesc sau prin organizarea unei anchete de dimensiuni mai mici în cazul 
refuzurilor. Metoda post-stratificării, însă, oferă o soluţie eficientă în cazul 
corectării non-răspunsurilor. Utilizând variabile de control prin care se realizează 
stratificarea, non-răspunsurile pot fi corectate prin reponderare, la nivelul fiecărui 
strat. Metoda este suficient de precisă şi nu implică costuri ridicate. 


Exemplu 

Considerăm o anchetă asupra consumului de carne în orașul laşi (date 
convenţionale), care îşi propune, printre altele, să estimeze consumul mediu lunar 
de carne pe un locuitor. 

Rezultatele anchetei, ţinând cont de grupa de vârstă a populaţiei cuprinse în 
eşantion, în urma aplicării unui sondaj aleator simplu, sunt prezentate în tabelul 
5.1. Pentru a îmbunătăţi calitatea estimatorului parametrului consum mediu de 
carne, ţinând cont de variabila suplimentară X - grupa de vârstă a populaţiei 
oraşului, se aplică procedeul de înlocuire a ponderilor obţinute la nivelul 
eşantionului cu cele oferite prin variabila suplimentară X. 
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Tabelul 5.1. Rezultatele anchetei 























Grupa de vârstă 3, consum mediu lunar de Th 
Ă (ani) carne (kg) n | 
0 - 20 0,54 12% 
185 | 0,75 27% 
36 - 50 | 0,92 36% | 
50 şi peste | 12 25% 
Total | - | 100% 








Conform tabelului 5.1, din eşantion au rezultat proporţiile E care 


structurează eşantionul în raport cu variabila grupa de vârstă. La nivelul 
eşantionului, se obţin patru post-straturi. 

Consumul mediu lunar de carne pe un locuitor este estimat punctual cu 
ajutorul mediei de la nivelul eşantionului. Ținând cont de cele patru post-straturi şi 
conform rezultatelor din tabelul 5.1, se calculează consumul mediu la nivelul 
eşantionului prin relația: 


4 
n 
y = Dă 5 = 0,54.0,12 + 0,75.0,27 + 0,92.0,36 + 1,12: 0,25 


3 = 0,879 kg 


Aşadar, consumul mediu lunar de carne pe un locuitor este estimat punctual, 
pe baza estimaţiei obţinute la nivelul eşantionului, la 0,879 kg carne. 

La nivelul populaţiei de referință (populaţia oraşului Iaşi), sunt cunoscute 
proporţiile pe grupe de vârstă, conform tabelului 5.2. 

Din tabelul 5.2 se observă că ponderile din eşantion diferă de cele de la 
nivelul populaţiei (pentru persoanele de peste 50 de ani sunt mai mici şi pentru 
persoanele de sub 20 de ani sunt mai mari). 


Tabelul 5.2. Structura populaţiei oraşului lași pe grupe de vârstă 























Grupa de vârstă N 
X (ani) N 
0 - 20 | 15% 
24-35 | 22% 
36 - 50 | 33% 
50 şi peste | 30% 
Total | 100% 








Estimatorul obţinut prin post-stratificare se determină înlocuind ponderile de 


. - . h 3 A? ră îi 
la nivelul eşantionului 7 cu cele cunoscute pe baza variabilei X, respectiv 


„ Nh 
ponderile TEL 
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Pe baza estimatorului obţinut prin post-stratificare, se obţine o estimaţie mai 
bună: 


4 
N 
Ypost = Da = 0,54-0,15 + 0,75-0,22 + 0,92-0,33 + 1,12: 0,30 
Psi 


Ypost = 0,885 kg 


Prin post-stratificare se obţine o valoare a estimatorului mai mare şi mai 
reală. Atât Y cât şi Yposc Sunt estimaţii obținute cu ajutorul unor estimatori 
nedeplasaţi ai mediei, dar Ypos: este mai precis. 


5.3. Estimatorul raport (7240) 


În practică, frecvent este foarte important să se cunoască raportul a doi 
parametri (medii sau totaluri). De exemplu, în anchetele economice este important 
să se estimeze venitul pe locuitor, rata şomajului etc. Pentru asemenea situații, se 
construieşte un estimator care are la bază un raport între doi parametri obținuți 
pentru două variabile. Ideea de bază a metodei este aceea de a dispune de 
informaţia suplimentară la nivelul întregii populaţii, adică de a cunoaște unul dintre 
parametri. Aşadar, metoda se foloseşte în cazurile în care se cunoaşte o variabilă 
suplimentară (X) corelată cu variabila de interes (Y) şi pentru care există rațiuni 
teoretice și practice pentru a estima un raport de forma: 


su 


T; 
1 xi 


5.3.1. Principiu 


Înainte de a intra în detaliile metodei, este important de subliniat că acest 
principiu a fost utilizat în mod concret de Laplace, în contextul unei anchete ce își 
propune să estimeze populaţia Franţei în anul 1802. Rezultatele au fost publicate în 
lucrarea Essai philosophique sur les probabilites, în anul 1814. Laplace 
construieşte un eșantion de 30 de comune franceze și obține un total al populaţiei 
de 2037615 de persoane. Pentru aceste comune, autorul cunoaşte numărul de 
nașteri, care este egal cu 71866, şi poate estima raportul dintre numărul populaţiei 
şi numărul de naşteri: 


pai e 2 28,35 
x 


De asemenea, Laplace consideră că dacă are la dispoziţie informaţii cu 
privire la numărul total de nașteri în anul 1802, poate construi o estimaţie pentru 
populația Franţei folosind regula de trei simplă: 
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i sati oale Lou E aileataaecaat total O cuuto fi la nivel de eşantion 
î total naşteri la nivel de eşantion 
În exemplul lui Laplace, informaţia suplimentară este reprezentată de 

numărul total de naşteri la nivelul populaţiei. Această informaţie este puternic 
corelată cu numărul de locuitori. Cu alte cuvinte, în acest exemplu se lucrează cu 
parametrul total, iar ca informaţie suplimentară se dispune de acest parametru la 
nivelul populaţiei. De asemenea, calculul realizat de Laplace presupune şi 
utilizarea unei estimaţii a parametrului la nivel de eșantion. În final, autorul 
dispune de o informaţie care poate fi calculată și ca un raport între parametru şi 
estimaţie. Pentru toate eșantioanele posibil de extras, aceasta este un raport între 
parametru și estimator: 

Tx 

în 
sau 


| >= 


Pentru a finaliza exemplul, Laplace consideră cunoscut numărul de nașteri în 
Franţa, în 1802, aproximându-l la un milion de persoane, și conchide că estimaţia 
cu privire la întreaga populaţie este obținută multiplicând această valoare cu 
raportul calculat mai sus (egal cu 28,35) și obține o populație totală de aproximativ 
28,35 de milioane de persoane la nivelul Franţei. 

Se consideră că variabila X, variabila suplimentară folosită în procedeul de 
ameliorare, este legată de variabila de interes Y printr-o relaţie de forma: 


y = R-xitui 


În relaţia de mai sus, R este un coeficient de proporţionalitate, un raport, iar 
u; sunt valori, numite reziduuri, care descriu abaterile de proporționalitate dintre 
cele două variabile X şi Y. Metoda se foloseşte atunci când valorile u; sunt mici. 
Pentru reziduuri se cunoaște proprietatea 


N 
i=1 

adică acestea se compensează la nivelul populaţiei de referință, dacă şi numai dacă 

are loc relaţia: 


> 
| 
| 
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În urma extragerii unui eşantion reprezentativ de volum n, într-un sondaj 
aleator simplu, de exemplu, se poate considera că şi la nivelul acestuia se 
compensează reciproc valorile reziduale, adică 3, î; = 0, ceea ce este echivalent 
cu a identifica o estimaţie a coeficientului de proporționalitate cu ajutorul relaţiei 
de forma: 


N 


= |“el 


Plecând de la acest principiu, se poate construi un estimator pentru media 
variabilei de interes prin relaţia: 


pr 
x 
sau 
2 să dle 
YR =Y'= 
x 
sau 
Ya se 
unde 
fie. 
x 


Estimatorul YR poartă numele de estimator raport. 
În cazul variabilei X, avem: 


= 


sp 
pl Si 


X= 


adică estimatorul raport îndeplineşte condiţia fundamentală prezentată în capitolul 
introductiv cu privire la tehnica ameliorării (estimatorul estimează cu varianţă zero 
parametrul pentru variabila A). 


Observația | 

În relaţia estimatorului raport apare, pe lângă estimatorul iniţial al mediei, un 
coeficient, un raport dintre media variabilei suplimentare şi estimatorul acesteia. La 
numitorul relaţiei este o variabilă aleatoare, estimatorul mediei variabilei X. 
Estimatorul raport este obţinut ca raport a două variabile aleatoare, a doi estimatori: 
estimatorul iniţial şi estimatorul determinat de variabila suplimentară X (media 
acesteia este cunoscută). 
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Observaţia 2 
Estimatorul construit mai sus este valabil și pentru parametrul total, pentru 


că raportul dintre două medii este egal cu raportul dintre două totaluri: 


PE a de 

Hy 1x 
deci 

î si 

v=Z Ta 


5.3.2. Proprietățile estimatorului 

Prezentăm proprietăţile acestui estimator: nedeplasarea și eficienţa. 

a. Proprietatea de nedeplasare 

Deoarece la numitorul estimatorului apare o variabilă aleatoare, pentru a 
putea aplica media se foloseşte o aproximare de ordinul unu în dezvoltarea în serie 
a estimatorului, în ipoteza că volumul eşantionului este mare și că termenii în 1/n?2 
sunt neglijabili. 

In aceste condiții se poate scrie: 


) 


Il 
»<I 
ol“ 
| 


x 

[| 

sp 
ol > 


5] <a 





iar prin dezvoltarea în serie obţinem: 


De-a) --) 


Prin aproximare, pentru un ordin de mărime în 1/n, se obţine: 


a a = a ara = A a 
a Za y—Y X-—ă x — X)(y—Y XI —ă 
apa SD, ) 


R=Y 











Aplicând media expresiei de mai sus, avem: 





Y 


a a cov(%,y) V(&) 
(a) = 7 SP 





Din relaţia de mai sus se observă că estimatorul raport este uşor deplasat. 
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Dacă explicităm relaţia de mai sus folosind relaţiile: 


rd 1 
V(X) = —V(A) = —o07 
n n 


E ale «al 
cov(x,y) = —p(X,Y) - ox - ov 


obţinem: 
2 _ Lat Y eo i oz 
( «) | n X.Y ras 
Deplasarea estimatorului este: 


SI |. - X,Y):ox: 
BD) = 27 | PO pe] 
n . 


care poate fi considerată nesemnificativă pentru un volum mare al eşantionului. 


Observaţii 
— dacă coeficientul de corelaţie dintre variabilele X şi Y este pozitiv, adică 
între cele două variabile există o legătură directă, atunci deplasarea este 


mică; 
— deplasarea este nulă atunci când 


sau 


= = pă,V)-o 
7 be )- op 
Ox 
adică atunci când variaţia lui Y este proporţională cu cea a lui X (dreapta de 
regresie trece prin origine). 


b. Varianţa estimatorului 
Reamintim că expresia estimatorului raport este: 


b 


sol i 


Pentru determinarea varianţei, se va realiza o dezvoltare a diferenţei: 


fe —Y =5.:3-fP 


| 

| 

» 
so] >= 
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Rezultă: 
Ze ol e e AO) ERA 
= î3 Ă X.Y zi dp 
a Dc aie au pdi32 
y—YVi/xX—ă 
Y 
iar 
e tsid a Să a dea e 20 2 
N Rr &-D0-7) (2-3 
(n-a p((077) 2 SP 
În aceste condiţii, 
zi De ti, aaa Aa. aa cov(ă,9) 1 _ 
aa, au = 2 ai AY — — Ye 
V(72) = Ma 7) =? (vo 23 79) 
Notând cu 
ia i 
îi 
avem: 


a 1 
V(3) = = (0Y — 2R - p(X,Y) : oxoy + R2: 02) 


Dacă ţinem cont de reziduu u; =y;—R:x,;, atunci varianţa estimatorului 


(3) = 202 


Pentru calculul unui interval de încredere, se poate estima varianţa 


raport se poate scrie: 


estimatorului raport cu ajutorul relaţiei: 





1 
Dr e ii 12. 1, 0 edi 12. 12 
sp, = (57 2R Toy SxSv tR Ss) 
sau 
n 
sp = sp Ra)? 
YR n-—1% n-14 ! 
l= 


unde 


198 Sondajul statistic 


R' = 


|“ 


Comparând varianţa estimatorului raport cu varianţa estimatorului iniţial, 
obţinut într-un sondaj aleator simplu, se observă că se obţine un câştig de precizie 
dacă: 


DL pipa 
Ox 2 
În concluzie, estimatorul raport este mai bun decât cel clasic dacă reziduurile 
au valori mici (au o varianță mică) şi dacă între variabila de interes Y şi variabila 
suplimentară X există o legătură aproximativ liniară, sub forma unei drepte care 
trece prin origine. 


Exemplu 

Considerăm un sondaj care are drept obiectiv estimarea venitului mediu al 
unui salariat din sectorul comercial dintr-un oraş (date convenţionale). 

Pe baza unui sondaj aleator simplu, venitul mediu lunar al unui salariat din 
comerţ s-a estimat punctual la o valoare de 2000 de lei. Cunoscând că la nivelul 
eşantionului s-a înregistrat un timp mediu de lucru zilnic al unei persoane de 9,2 
ore şi cunoscând dintr-un studiu anterior că timpul mediu zilnic de lucru al unei 
persoane din sectorul comercial este de 9,8 ore, se poate redresa calitatea 
rezultatului obţinut cu ajutorul estimatorului raport, luând în considerare timpul de 
lucru al unui salariat din acest sector. 

Notăm cu Y variabila venit lunar pe un salariat din comerțul oraşului 
considerat, iar cu X variabila timp de lucru zilnic pe un salariat. Se cunosc 
următoarele date: 

3 = 2000 de lei, * =92h,X =9,8h. 

Estimatorul raport are următoarea relaţie: 


Pentru datele de la nivelul eşantionului se obţine estimaţia: 


R>Y? 


3 | 


= 2000 E = 2130,43 de lei 


Pe baza estimatorului raport, s-a obținut o valoare estimată a venitului mediu 
mai mare decât în cazul estimatorului clasic, folosind media de selecţie. Acest 
rezultat este afectat de variabila timp de lucru zilnic, variabilă puternic corelată cu 
variabila de interes şi cu care se află într-un raport de proporţionalitate. 

Sub aspectul eficienţei, metoda de redresare cu ajutorul estimatorului raport 
aduce nu numai un câştig relativ de precizie. Metoda poate fi comparată cu 
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sondajul aleator cu probabilităţi inegale, care însă este mult mai dificil de aplicat şi 
mai costisitor. 


5.4. Estimatorul regresie 


Ca şi în cazul metodei de ameliorare prezentate în capitolul anterior, se 
pornește de la premisa existenţei unei variabile suplimentare X, puternic corelată cu 
variabila de interes, şi că între aceste variabile există o dependenţă liniară. 


5.4.1. Principiu 
Această metodă de ameliorare are la bază următoarea relaţie între variabila 
de interes şi variabila suplimentară: 
y=a+tB-xitui 


Relaţia de mai sus reprezintă ecuaţia unei drepte care este afectată de 
reziduurile u;. Alegerea parametrilor a, f se face prin îndeplinirea condiţiei de 
compensare a reziduurilor la nivelul populaţiei. 

Conform metodei celor mai mici pătrate, se obţin următoarele valori pentru 
parametrii a, f, care îndeplinesc condiţia cerută mai sus: 


di (ăi = XR 
şi 
ă=P-BĂ 
În aceste condiţii, are loc: 
Y=a+Bă 


Dacă dorim să estimăm parametrul medie în condiţiile unui sondaj aleator 
simplu, atunci se poate considera că pentru un eşantion reprezentativ se poate scrie: 


y=a+B-:xX 
Din relaţiile de mai sus, se obţine: 
Y-y=BĂ-2) 
sau 
Y=y7+BĂ 2) 
Acest principiu a condus la construirea unui estimator pentru parametrul 


medie a variabilei Y, ţinând cont de trei estimatori: estimatorul iniţial al mediei, 
estimatorul mediei variabilei X şi estimatorul parametrului f. 
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Astfel, se defineşte estimatorul: 


Viza => 3+Pă 2 
care se numeşte estimator regresie, în care 
fi Best — 2 — 7) 
iesi — X) 


şi 
â=y-B-ă 
La nivel de eșantion, estimaţia parametrului medie obţinută cu această 
metodă se determină pe baza relaţiei: 
Yreg = y+ b(X =) 
Relaţia se poate scrie și în funcţie de coeficientul de corelaţie dintre cele 
două variabile, ştiind că: 


Ss 
b = ay 
Toy 2 
Rezultă: 
— — s SS — 
Yreg =yYt Tey = CĂ 0) 
y 
Observaţie 


Ideea de bază a acestui estimator este să se estimeze media populaţiei totale 
(Y) prin intermediul punctului de pe dreapta de regresie care are abscisa X, punct 
obţinut prin metoda celor mai mici pătrate. 

Pentru a = 0, problema se reduce la cazul estimatorului raport. În plus, se 
observă că f este estimat cu ajutorul estimatorului f, care este un estimator de tip 
raport. 


5.4.2. Proprietăţile estimatorului 


a. Nedeplasarea 

Estimatorul regresie este un estimator uşor deplasat, cu o deplasare care are 
un ordin de mărime în 1/n egal cu unu. Pentru eşantioane de volum mare, această 
deplasare devine neglijabilă, însă pentru eşantioane de volum mic (n < 30), 
deplasarea este semnificativă. 
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b. Varianţa 
Ca şi în cazul estimatorului raport, varianța estimatorului regresie este: 


V(freg) = za 


unde 
ui =y—0-fB-xi 
Şi 
i N 
ci = Dad 
i=1 
Dar 


2 
_ = o o 
Di a 2 2 E tea0, XY 2 ăY 
Oi =0p +6 că - adam = of + (2) Ga xy 
x x 


De unde rezultă că: 


ae 
02 = 02 — (2 = 0? — p(X,V)o? = o?(1 —p(X,Y)) 


În concluzie, 


A 


a 1 
V(freg) = 02 = Lof(a — p(ă,7)) = VU pă,v)) 
Varianţa estimatorului regresie este dată prin relaţia: 


V(freg) = VU — pă, Y)) 


relaţie care arată că prin acest estimator s-a obţinut un plus de precizie. Varianţa 
estimatorului regresie este întotdeauna mai mică decât a estimatorului iniţial, fiind 
egale doar în cazul în care între variabilele X şi Y nu există nici o legătură 
(coeficientul de corelaţie este zero). 

Se recomandă ca această metodă de ameliorare să fie folosită în toate 
cazurile în care se dispune de o variabilă X cunoscută la nivelul populaţiei de 
referinţă şi care este corelată cu variabila de interes Y. 

Pentru calculul unui interval de încredere, se poate estima varianța 
estimatorului raport cu ajutorul au 


Sf = sy 2(1 — 23) 
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unde 7„y este estimaţia coeficientului de corelaţie simplă pentru cele două 
variabile, calculată la nivelul eșantionului. 

Observaţie 

Se poate observa că estimatorul regresie este un caz particular al 
estimatorului de forma: 


Ya = +y(ă 2) 


numit esfimator prin diferenţă. 
Dacă este cunoscută valoarea lui y (y = y9), estimatorul se numeşte estimator 
prin diferență generalizat, iar dacă valoarea lui y este necunoscută, suntem în cazul 


estimatorului regresie. 
Estimatorul prin diferenţă generalizat are următoarele proprietăţi: 
-— este nedeplasat: 


E(faip) = EG) + vo -EQ- D=? 
—  varianţa estimatorului este dată de relaţia: 


V(fap) = VO) +72 -v = 2macovă, 3) 


= 1 
(fur) = (0? + to — 2vopQ, Doxav) 


Estimatorul prin diferență generalizat aduce o îmbunătăţire a preciziei dacă se 
poate obţine acea valoare a lui yg care să determine o varianță minimă a diferenţelor: 
di = y; — Vox; 

Valoarea lui yg se poate obține din cercetări anterioare sau prin şedinţe 
precum brainstorming. 

Exemplu 

Considerăm un sondaj aleator simplu realizat cu obiectivul de a estima 
producția medie de cereale boabe la nivelul unei unităţi agricole dintr-un judeţ. În 
acest scop, s-a constituit un eşantion reprezentativ format din cinci unităţi agricole ale 
județului, pentru care s-au obţinut rezultatele din tabelul 5.3 (date convenţionale). 


Tabelul 5.3. Producţia de cereale şi suprafața cultivată 


























| 145 76 | 
Total | 1016 506 


Unitate Producţia Suprafaţa 
Y (tone) Ă (ha) 

1 150 79 

î 169 | 96 
[3 260 107 | 
| 4 | 292 148 
[5 
| 








Utilizarea unei informaţii suplimentare 203 


Cunoscând aceste rezultate şi că suprafaţa medie cultivată cu cereale într-o 
unitate agricolă a judeţului este de 110 ha, se poate redresa calitatea estimatorului 
producţiei medii de cereale boabe cu ajutorul estimatorului regresie. 

Estimatorul clasic al unui total este 


a _1 Ș 
Y= n Yi 
LES 
iar la nivelul eşantionului se calculează estimaţia: 
i CI 
3 = iza Yi = 203,2 


Estimatorul clasic poate fi îmbunătăţit considerând informaţia suplimentară 


oferită de variabila X - suprafaţa cultivată. 
Estimatorul regresie are expresia: 


Yreg = + BĂ-3) 

unde 

Dietz =); > >) 
Vies(xi ie 7)? 


La nivelul eşantionului extras, estimaţia parametrului de regresie se obţine 


â = 


prin relaţia: 
_5 Pica i * Yi — Xiza i * Xiz Yi 
Sia (Dia x) 
Conform datelor din tabelul 5.4, se poate obţine estimaţia parametrului de 
regresie: 
__5- 110130 — 1016 - 506 
5 . 54586 — 256036 
Tabelul 5.4. Elemente de calcul 


Yi | YiXi x? 
150 


| 
| 79 | 11850 624] 
— 169 | 96 | 16224 9216 
260 107 27820 | 11449 
| 292 148 43216 | 21904 
5 145 76 11020 5776 
Total | 1016 | 506 | 110130 | 54586 


= 2,16 





Xi 





P|o|I— 





Înlocuind în expresia estimatorului, se obține estimaţia parametrului medie 
cu ajutorul estimatorului regresie: 
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reg = 3 + bă — 2) = 203,2 + 2,16(110 — 101,2) = 222,2. 


Se observă că estimaţia obținută în urma redresării este mai mare decât cea 
obţinută clasic, însă important este că această valoare este preferabilă celei obținute 
cu estimatorul clasic în sensul preciziei mai ridicate. 


5.5. Exerciţii 


|. Se realizează o anchetă asupra studenților (un eşantion de 100 de 
persoane) unei universităţi (care are un total de 5000 de studenţi), pentru a testa 
abilitățile de comunicare în scris cu ajutorul unui test. Rezultatele testului 
(ponderea celor care trec testul) şi structura studenților universității după profilul 
liceului absolvit (Real, Uman, Vocaţional) sunt prezentate în tabelul 5.5. 


Tabelul 5.5. Rezultate anchetă şi structură populaţie 
|__ Profilul | N;/N x 100 . n; /n x 100 

















|___ Real 45 15 
| Uman 35 | 40 
| Vocaţional 20 | 25 
|__Total | 100 | 80 








Se cere: 

— să se estimeze punctual și prin interval de încredere procentul studenţilor 
care trec examenul la nivelul întregii universități; 

— să se estimeze procentul celor care trec testul utilizând informaţia 
suplimentară privind structura studenţilor după liceul absolvit. 


2. În ancheta prezentată la exercițiul 1, s-au înregistrat datele şi s-au calculat 
estimaţiile pentru punctajul obţinut (variabila X) de studenţii din eșantion. 
Rezultatele sunt prezentate în tabelul 5.6. 


Tabelul 5.6. Rezultate anchetă şi structură populație 




















Profilul S/2 Xa | ma | ON 
Real 100 70| 15 | 2250 
Uman 120 85 40 1750 
Vocaţional 90 80 25 1000__| 
Total | = | ă 100 5000] 





Se cere: 
— să se estimeze punctual și prin interval de încredere punctajul mediu al 
studenților la nivelul întregii universităţi; 
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— cu ajutorul informaţiei privind structura populaţiei studenţilor, să se estimeze 
punctual și prin interval de încredere punctajul mediu la nivelul universității. 


3. Se consideră o anchetă (un eşantion de 100 de persoane) la nivelul 
studenților unei facultăţi privind capacitatea de analiză (variabila de interes Y) a 
unei anumite probleme complexe. Rezultatele unui test au fost cuantificate cu un 
punctaj, iar la nivel de eşantion s-a obținut un punctaj mediu de 8,5 şi o abatere 
standard de 1,2 puncte. De asemenea, la nivel de eșantion se cunosc rezultatele la 
examenul de matematică (variabila suplimentară X), cu o medie de 7,9 puncte și o 
abatere standard de 2 puncte. Asumând ipoteza că există o legătură semnificativă 
între cele două variabile (coeficientul de corelaţie simplă estimat pentru cele două 
variabile este egal cu 0,82), se cere: 

— să se estimeze punctual și prin interval de încredere punctajul mediu pentru 
variabila de interes utilizând un estimator de tip raport; 

— se cere acelaşi lucru ca mai sus, în condiţiile utilizării unui estimator de tip 
regresie. Se cunoaşte că media la examenul de matematică, la nivelul 
populaţiei totale este egală cu 8,2 puncte; 

— să se compare cele două rezultate. 








Tabele probabiliste 


Sondajul statistic 








Funcţia ai 





P(z)= je? zar 


Î.0;00 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 | 0,09 
|__0,0 | 0,0000] 0,0040| 0,0080| 0,0120] 0,0160] 0,0199| 0,0239] 0,0279| 0,0319! 0,0359 




















[0,4 | 0,0398] 0,0438] 0,0478] 0,0517| 0,0557] 0,0596| 0,0636| 0,0675| 0,0714! 0,0753] 





0,2 0,0793| 0,0832| 0,0871| 0,0910| 0,0948| 0,0987! 0,1026| 0,1064| 0,1103; 0,1141 





0,3 0,1179| 0,1217| 0,1255| 0,1293| 0,1331| 0,1368! 0,1406| 0,1443| 0,1480| 0,1517 


| 0,4 0,1554| 0,1591| 0,1628| 0,1664| 0,1700 0,1736] 0,1772 0,1808 0,1844 0,1879 
0,5 0,1915] 0,1950| 0,1985| 0,2019| 0,2054| 0,2088| 0,2123| 0,2157| 0,2190| 0,2224 











0,6 0,2257 0,2291 0,2324| 0,2357 0,2389| 0,2422| 0,2454| 0,2486) 0,2517| 0,2549 





0,7 | 0,2580] 0,2611] 0,2642| 0,2673| 0,2704| 0,2734! 0,2764| 0.2794| 0,2823| 0,2852 





0,8 | 0,2881| 0,2910| 0,2939| 0,2967 0.2995 0,3023| 0,3051| 0,3078| 0,3106| 0,3133 





0,9 0,3159 0,3186] 0,3212| 0,3238 0,3264 0,3289| 0,3315| 0,3340 0,3365| 0,3389 
1,0 0,3413| 0,3438| 0,3461| 0,3485| 0,3508| 0,3531| 0,3554| 0,3577 0,3599| 0,3621 








11 0,3643] 0,3665| 0,3686 0,3708 0,3729) 0,3749] 0,3770! 0,3790! 0,3810| 0,3830 





1,2 0,3849| 0,3869] 0,3888 0,3907] 0,3925| 0,3944| 0,3962] 0,3980! 0,3997! 0,4015] 








1,3 0,4032| 0,4049| 0,4066| 0,4082 0.4099] 0,4115] 0,4131| 0,4147| 0,4162| 0,4177 





cata 


1,4 0,4192| 0,4207 | 0,4222) 0,4236| 0,4251 0,4265| 0,4279| 0,4292| 0,4306| 0,4319 








15| 0.4332] 0,4345 0.4357] 0.4370) 0,4382 0,4394] 0,4406] 0,4418] 0,4429] 0,4441 





1,6 0,4452) 0,4463 O.aa7a| 0,4484| 0,4495 0,4505 0,4515) 0,4525| 0,4535| 0,4545 











1,7 04554] Bidecă! 0,4573) 0.4582] 0,4591) 0,4599| 0,4608] 0,4616| 0,4625] 0,4633 


1,8 | 0.4641 | 0,4649] 0,4656) 0,4664) 0,4671] 0,4678] 0,4686] 0,4693| 0,4699] 0,4706 


==: sita ja 





19| 0,4713] 0,4719] 0.4726| 0.4732] 04738] 0,4744. 0,4750| 0,4756] 0.4761] 0,4767 





2,0 DA al 0,4778| 0,4783] 0,4788 0,4793) 0,4798| 0,4803| 0,4808| 0,4812| 0,4817 





2,1 | 0,4821| 0,4826| 0,4830| 0,4834| 0,4838 0,4842| 0,4846) 0,4850| 0,4854| 0,4857 


2,2 0,4861) 0,4864 0,4868] 0,4871| 0,4875) 0,4878| 0,4881] 0,4884| 0,4887| 0,4890 
2,3 0,4893| 0.4896] 0,4898| 0,4901| 0,4904 _0,4906) 0,4909] 0,4911| 0,4913] 0,4916 


2,4 0,4918| 0,4920| 0,4922| 0,4925| 0,4927 _0,4929| 0,4931| 0,4932] 0,4934] 0,4936 











2,5 0,4938 0,4940 0,4941| 0,4943| 0,4945| 0,4946! 0,4948| 0,4949| 0,4951| 0,4952 














2,6 0.4953] 0,4955 0,4956) 0,4957| 0,4959 0,4960| 0,4961] 0,4962| 0,4963] 0,4964 


2,7 | 0.4965! 0,4966] 0,4967| 0,4968] 0,4969] 0.4970] 0.4971] 0.4972] 0,4973] 0,4974 








2,8 | 0,4974. 4079! 0,4976| 0,4977| 0,4977 0,4978 0.4979 0,4979 0,4980! 0,4981 








2,9 | 0,4981 0,4982|_0 0,4982 0,4983| 0,4984 0,4984| 0,4985 0,4985| 0,4986| 0,4986! 
3,0 | 0,4987] 0,4987| 0,4987 0,4988| 0,4988| 0,4989| 0,4989| 0,4989| 0,4990| 0,4990! 
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Repartiția Student 


pP=P(t>tp) 
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3,078 12,706 63,657 
1,533 2,776 3,747 
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314| 1.703 2052] 273] 2771 
2 | | 
2 | | 
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1,645 1,960 2,326 2,576 
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Repartiția Chi-pătrat 





p=P(4 > 2) 
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Tabele probabiliste 


Repartiția Chi-pătrat 


p= P(2" > pa) 
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0,41174 0,55430 0,83121 1,14548 1,61031 
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Repartiția Fisher 


a = 0,05 
dfi= n, df-= na 
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Repartiția Fisher 












a =0,01 
df1> nu, df> na 
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Repartiția Fisher 


a = 0,025 
dfi= nu, df-= n 
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Repartiția Durbin-W atson 


a = 0,05; k reprezintă numărul de parametri din model 





























































































































































































k=2 k=3 k=4 | k=5 
n d. du d. du d. du d. du 
7 10,700 | 1,356 [0,467 [1,896 | | | ERE 
|_8__| 0,763 | 1,332 | 0,559 | 1,777 | 0,367 | 2.287 | oa 
9 | 0,824 | 1,320 | 0,629 | 1,699 | 0,455 | 2,128 | 0,296 | 2,588 
10| 0.879 | 1,320 | 0,697 | 1,641 | 0,525 | 2,016 | 0,376 | 2,414 
11_| 0,927 | 1,324 | 0,758 | 1,604 | 0,595 | 1,928 | 0,444 | 2,283 | 
12 | 0,971 | 1,331 | 0,812 | 1,579 | 0,658 | 1,864 | 0,512 | 2,177 
13 | 1,010 | 1,340 [| 0,861 | 1,562 [0,715 | 1,816 | 0,574 | 2,094 | 
14_| 1,045 | 1,350 | 0,905 | 1,551 | 0,767 | 1,779 | 0,632 | 2,030 
15_| 1,077 | 1.361 | 0,946 | 1,543 | 0,814 | 1,750 | 0,685 | 1,977 | 
16_| 1,106 | 1,371 | 0,982 | 1,539 | 0,857 | 1,728 | 0,734 | 1,935] 
17_| 1,133 | 1,381 | 1,015 | 1,536 | 0,897 | 1,710 | 0,779 | 1,900] 
18_| 1,158 | 1,391 | 1,046 | 1,535 | 0,933 | 1,696 | 0,820 | 1,872 | 
19 | 1,180 | 1,401 | 1,074 | 1,536 | 0,967 | 1,685 | 0,859 | 1,848 
20 | 1,201 | 1,411 | 1,100 | 1,537 | 0,998 | 1,676 | 0,894 | 1,828 
21 | 1,221 | 1,420 | 1,125 | 1,538 | 1,026 | 1,669 | 0,927 | 1,812 
22 | 1,239 | 1,429 | 1,147 | 1,541 | 1,053 | 1,664 | 0,958 | 1,797 
23 | 1,257 | 1,437 | 1,168 | 1,543 | 1,078 | 1,660 | 0,986 | 1,785 
24 | 1,273 | 1,446 | 1,188 | 1,546 | 1,101 | 1,656 | 1,013 | 1,775 
25 | 1,288 | 1,454 | 1.206 | 1,550 | 1,123 | 1,654 | 1,038 | 1,767 
26 | 1,302 | 1,461 | 1,224 | 1,553 | 1,143 | 1,652 | 1,062 | 1,759 
27 | 1.316 
28 | 1,328 1,560 | 1,181 | 1,650 | 1,104 | 1,747 
29 | 1,341 | 1,483 | 1,270 | 1,563 | 1,198 | 1,650 | 1,124 | 1,743 
30| 1,352 
31_| 1,363 | 1,496 | 1,297 | 1,570 | 1,229 | 1,650 | 1,160 | 1,735 
32 | 1,373 | 1,502 | 1,309 | 1,574 | 1,244 | 1,650 | 1,177 | 1,732 
33 | 1,383 | 1,508 | 1,321 | 1,577 | 1,258 | 1,651 | 1,193 | 1,730 
34 | 1,393 | 1,514 | 1,333 | 1,580 | 1,271 | 1,652 | 1,208 | 1,728 
35 | 1,402 | 1,519 | 1,343 | 1,584 | 1,283 | 1,653 | 1,222 | 1,726 
36_| 1,411 | 1,525 | 1,354 | 1,587 | 1,295 | 1,654 | 1,236 | 1,724 
37| 1,419 | 1,530 | 1,364 | 1,590 | 1,307 | 1,655 | 1,249 | 1,723 
38_| 1,427 | 1,535 | 1,373 | 1,594 | 1,318 | 1,656 | 1,261 | 1,722 
39 | 1,435 | 1,540 | 1,382 | 1,597 | 1,328 | 1,658 | 1,273 | 1,722 
40 | 1,442 | 1,544 | 1,391 | 1,600 | 1,338 | 1,659 | 1,285 | 1,721 
45_| 1,475 | 1,566 | 1,430 | 1,615 | 1,383 | 1,666 | 1,336 | 1,720 
50_| 1,503 | 1,585 | 1,462 | 1,628 | 1,421 | 1,674 | 1,378 | 1,721 
55_| 1,528 | 1,601 | 1,490 | 1,641 | 1,452 | 1,681 | 1,414 | 1,724 
60 | 1,549 | 1,616 | 1,514 | 1,652 | 1,480 | 1,689 | 1,444 | 1,727 
65_| 1,567 | 1,629 | 1,536 | 1,662 | 1,503 | 1,696 | 1,471 | 1,731 
70_| 1,583 | 1,641 | 1,554 | 1,672 | 1,525 | 1,703 | 1,494 | 1,735 
75_|_ 1,598 | 1,652 | 1,571 | 1,680 | 1,543 | 1,709 | 1,515 | 1,739 
80 | 1,611 | 1,662 | 1,586 | 1,688 | 1,560 | 1,715 | 1,534 | 1,743 
85 | 1,624 | 1,671 | 1,600 | 1,696 | 1,575 | 1,721 | 1,550 | 1,747 
90 | 1,635 | 1,679 | 1,612 | 1,703 | 1,589 | 1,726 | 1,566 | 1,751 
95 | 1,645 | 1,687 | 1,623 | 1,709 | 1,602 | 1,732 | 1,579 | 1,755 
100 | 1,654 | 1,694 | 1,634 | 1,715 | 1,615 | 1,736 | 1,592 | 1,758 
150 | 1,720 | 1,747 | 1,706 | 1,760 | 1,693 | 1,774 | 1,679 | 1,788 
200 | 1,758 | 1,779 | 1,748 | 1,789 | 1,738 | 1,799 | 1,728 | 1,809 
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